成人乱人伦一区二区三区,国产片aⅴ在线观看国语,在线免费观看一级黄片,人人爽人人妻人人做日韩精品,国产一级a毛一级a看免费视频

行業動態 行業動態

分享|能力驗證中離群數據應該怎樣判斷和處理?

2023-03-13 作者: 瀏覽數:1142

離群數據(ju)來源(yuan)與(yu)判斷

01

離(li)群值按產生原因(yin)分(fen)為兩類

a)第一類離群值是總體固有(you)變異性的極端(duan)表現,這類離群值與樣本(ben)中其余(yu)觀測(ce)值屬于同一總體;

b)第二類(lei)離群(qun)值(zhi)是由(you)于(yu)試(shi)驗(yan)(yan)條件和試(shi)驗(yan)(yan)方(fang)法的(de)(de)偶然偏(pian)離所產生(sheng)的(de)(de)結(jie)果(guo),或產生(sheng)于(yu)觀測、記錄、計算(suan)中的(de)(de)失誤,這(zhe)類(lei)離群(qun)值(zhi)與樣本中其(qi)余觀測值(zhi)不屬于(yu)同一總(zong)體。對離群(qun)值(zhi)的(de)(de)判定通常可(ke)根據技術上或物理上的(de)(de)理由(you)直接進行,例如當(dang)(dang)試(shi)驗(yan)(yan)者(zhe)已經(jing)知道試(shi)驗(yan)(yan)偏(pian)離了規(gui)定的(de)(de)試(shi)驗(yan)(yan)方(fang)法,或測試(shi)儀器發生(sheng)問(wen)題等。當(dang)(dang)上述理由(you)不明確時,可(ke)用本標(biao)準規(gui)定的(de)(de)方(fang)法。


02

離群值的(de)三種情形(xing)

本(ben)標準(zhun)在下述不同情形下判斷樣本(ben)中(zhong)的離群值(zhi):

a)上側情(qing)形:根據實際情(qing)況或以(yi)往經(jing)驗,離(li)群值(zhi)都為高(gao)端值(zhi);

b)下側情形:根(gen)據(ju)實際情況或以往經驗,離群值(zhi)都為低(di)端(duan)值(zhi);

c)雙側(ce)情(qing)形:根(gen)據(ju)實(shi)際情(qing)況或以往(wang)經驗,離群值(zhi)(zhi)可(ke)為高端(duan)值(zhi)(zhi),也可(ke)為低端(duan)值(zhi)(zhi)。


03

檢(jian)出離群值個數的上限

應(ying)規(gui)定在樣本中檢出(chu)離(li)群值個數的上(shang)限(與樣本量相比應(ying)較(jiao)小),當(dang)檢出(chu)離(li)群值個數超(chao)過了這個上(shang)限時,對此樣本應(ying)作慎重的研究(jiu)和處理。


04

單個離群值(zhi)情形

a)依實際情況或以往經驗(yan)選定,選定適宜的離群值檢(jian)驗(yan)規(gui)則(格拉布斯檢(jian)驗(yan)、狄克遜檢(jian)驗(yan)等);

b)確定適當的顯(xian)著性水(shui)平(ping);

c)根據(ju)顯著性(xing)水(shui)平及樣本(ben)量(liang),確定檢驗的臨(lin)界值(zhi)(zhi);d)由觀測值(zhi)(zhi)計算相應(ying)統計量(liang)的值(zhi)(zhi),根據(ju)所得(de)值(zhi)(zhi)與臨(lin)界值(zhi)(zhi)的比較結果(guo)作(zuo)出判斷。


05

判定多個離群值的檢驗規則

在允許檢(jian)出(chu)(chu)離(li)群(qun)值(zhi)(zhi)的個(ge)數(shu)大于1的情況下,重復(fu)使用(yong)檢(jian)驗(yan)規則(ze)進行檢(jian)驗(yan)。若沒有(you)檢(jian)出(chu)(chu)離(li)群(qun)值(zhi)(zhi),則(ze)整個(ge)檢(jian)驗(yan)停止;若檢(jian)出(chu)(chu)離(li)群(qun)值(zhi)(zhi),當檢(jian)出(chu)(chu)的離(li)群(qun)值(zhi)(zhi)總數(shu)超(chao)過上(shang)限時,檢(jian)驗(yan)停止,對(dui)此(ci)樣本應慎重處(chu)理,否(fou)則(ze),采用(yong)相同的檢(jian)出(chu)(chu)水平和相同的規則(ze),對(dui)除去已檢(jian)出(chu)(chu)的離(li)群(qun)值(zhi)(zhi)后余(yu)下的觀測值(zhi)(zhi)繼續檢(jian)驗(yan)。


離群(qun)值(zhi)處理(li)

01

處理方式

處理離群值的方式有:

a)保留離群(qun)值并用于后續數據處理;

b)在找(zhao)到實際原(yuan)因時修正(zheng)離(li)群值,否(fou)則予(yu)以(yi)保(bao)留;

c)剔除(chu)離群值(zhi),不追(zhui)加觀測值(zhi);

d)剔(ti)除離(li)群值,并(bing)追(zhui)加新的觀測值或用適(shi)宜的插(cha)補值代替。

格魯布斯檢(jian)驗方法: 

在定量分析(xi)實驗中,實驗結束(shu)后,必須對分析(xi)數(shu)(shu)(shu)據進行處(chu)理,在一組分析(xi)數(shu)(shu)(shu)據中,往(wang)往(wang)有個別數(shu)(shu)(shu)據與(yu)其(qi)它(ta)數(shu)(shu)(shu)據相差較大,這種個別數(shu)(shu)(shu)據稱為(wei)可疑(yi)值。

對可疑值的(de)(de)處理,應首先回顧和檢查生產可疑值的(de)(de)實驗(yan)過(guo)程,有無可覺察(cha)到的(de)(de)技術上的(de)(de)異常原因。

當原因(yin)不明時,必(bi)須按一(yi)定的(de)數理統(tong)計方(fang)法進(jin)行處理,決定是保(bao)留(liu)還是舍棄(qi)。

格魯(lu)布(bu)斯檢(jian)驗法(fa)效果比較好的(de)(de)方(fang)法(fa)。格魯(lu)布(bu)斯檢(jian)驗法(fa)的(de)(de)優點是在判斷可(ke)疑值(zhi)取(qu)舍的(de)(de)過程(cheng)中,將正態分布(bu)中的(de)(de)兩個(ge)最(zui)重要的(de)(de)參(can)數—平均值(zhi)和標準偏差(cha)引進來,故(gu)方(fang)法(fa)的(de)(de)準確性較高(gao)。方(fang)法(fa)計(ji)算的(de)(de)過程(cheng)是這樣的(de)(de):

1.實驗得出一組(zu)數據X1;X2;X3;X4……Xn,懷(huai)疑(yi)(yi)其中(zhong)某個(ge)數據可(ke)疑(yi)(yi)(X可(ke)疑(yi)(yi))

2.計算X1;X2;X3;X4……Xn 的平均數(shu)(X平均)標準偏差(S)

3.計(ji)算(suan)格(ge)魯布斯(si)G計(ji)算(suan)=(X平均-X可疑)/S,取絕對值

4.查表求格魯布斯(si)G查表

5.若(ruo)G計算(suan)≥G查表,則可(ke)疑(yi)數據舍去(qu),反之保(bao)留


02

處理規則(ze)

對檢出的(de)(de)離(li)群(qun)值(zhi),應(ying)盡可能尋(xun)找(zhao)其(qi)技術上(shang)和物理上(shang)的(de)(de)原因,作(zuo)為處(chu)理離(li)群(qun)值(zhi)的(de)(de)依據。應(ying)根據實際(ji)問題的(de)(de)性質(zhi),權衡尋(xun)找(zhao)和判(pan)(pan)定產生離(li)群(qun)值(zhi)的(de)(de)原因所需(xu)代價(jia)、正(zheng)確(que)判(pan)(pan)定離(li)群(qun)值(zhi)的(de)(de)得(de)益及錯誤剔(ti)除正(zheng)常觀測值(zhi)的(de)(de)風險,以確(que)定實施下述三(san)個規則之一:

a)若在技術(shu)上(shang)或物(wu)理上(shang)找到了產(chan)(chan)生離群值的原(yuan)因(yin),則應剔(ti)除(chu)或修正(zheng);若未找到產(chan)(chan)生它的物(wu)理上(shang)和技術(shu)上(shang)的原(yuan)因(yin),則不得(de)剔(ti)除(chu)或進行修正(zheng)。

b)若在技術上或物(wu)理(li)上找到產生離(li)(li)(li)群值的(de)原因,則應剔除(chu)或修(xiu)正(zheng);否(fou)則,保留(liu)歧(qi)離(li)(li)(li)值,剔除(chu)或修(xiu)正(zheng)統(tong)計離(li)(li)(li)群值;在重復使用同一(yi)檢驗規則檢驗多(duo)個離(li)(li)(li)群值的(de)情形(xing),每(mei)次檢出離(li)(li)(li)群值后(hou),都要(yao)再檢驗它是否(fou)為(wei)統(tong)計離(li)(li)(li)群值。

若某次檢出(chu)的離(li)群值(zhi)(zhi)為統計(ji)離(li)群值(zhi)(zhi),則此離(li)群值(zhi)(zhi)及在它前面(mian)檢出(chu)的離(li)群值(zhi)(zhi)(含歧離(li)值(zhi)(zhi))都應被剔除(chu)或修(xiu)正(zheng)。

c)檢出的離群值(zhi)(zhi)(含歧(qi)離值(zhi)(zhi))都應(ying)被剔除或進(jin)行修正。


03

備案

被(bei)剔除或修正的觀測值及其理由(you)應(ying)予記錄,以備(bei)查詢。


推薦新聞

查看全部 >>
  • 微信咨詢
  • 返回頂部