Sådan Afvis Outliers i data

data indsamlet under eksperimenter, undersøgelser og andre informationsindsamlende procedurer er normalt behæftet med en vis mængde af tilfældighed.I nogle tilfælde kan individuelle målinger eller svar synes langt væk det forventede resultat;disse er outliers.Når du støder på en outlier, bør du tjekke det at afgøre, om du bør afvise det helt.

Instruktioner

  1. Undersøg outlier at være sikker på, at det passer kvalitativt med resten af ​​dataene.For eksempel, hvis du spørger 20 mennesker til at måle bredden af ​​en skilling, men en af ​​dem faktisk måler bredden af ​​et kvartal, kan du have en outlier i dataene.Du bør afvise denne outlier, fordi det ikke passer kvalitativt med eksperimentet.

  2. Brug Dixon Q-test, hvis du ikke afviser outlier på grundlag af kriteriet i trin 1. Q-test er et kvantitativt mål i statistikkerne for betydningen af ​​en bestemt værdi i forhold til et sæt af data.

  3. Bestem konfidensniveau for Q-test.Hvis du ønsker at være 90 procent sikker på, at outlier bør eller ikke bør

    afvises, skal du vælge et konfidensniveau på 90 procent.

  4. Find den kritiske Q-værdi (Qcrit) under anvendelse af en tabel.Du skal kende antallet af værdier i datasættet (fx N) og den tillid niveau, som du vælger i trin 3.

  5. Arranger datasættet i stigende rækkefølge.Således for hver værdi i sættet, X (i), arrangere dataene, så at X (1) & lt;X (2) & lt;... & Lt;X (N - 1) & lt;X (N).

  6. Beregn den eksperimentelle Q-værdi (Qexp) i outlier.For enlige outliers vildskuddet enten X (1) eller X (N) i data arrangement fra trin 5. De respektive Q-værdier for disse to tilfælde er [X (2) - X (1)] / [X (N) - X (1)] og [X (N) - X (N - 1)] / [X (N) - X (1)].

  7. sammenligne den eksperimentelle Q-værdi fra trin 6 til den kritiske Q-værdi fra trin 4. Hvis Qexp er større end Qcrit, så skal du afvise outlier.Hvis Qexp er mindre end Qcrit, så skal du holde outlier i data.Din accept eller afvisning af outlier har et konfidensniveau efter hvad du har valgt i trin 3 (for eksempel, er du 90 procent sikker på, at du skal afvise outlier).

Tips & amp;Advarsler

  • Højere tillid niveauer føre til højere kritiske Q-værdier.Som et resultat, hvis du ønsker at være mere sikker på, at du bør afvise en bestemt outlier, skal denne outlier være mere åbenlyst ude af sted i forhold til resten af ​​dataene.
  • Dixon Q-test virker bedst for små stikprøvestørrelser.Større stikprøvestørrelser kan kræve andre statistik tests.
  • Hvis du har flere outliers, bør du bruge en anden statistik test end Q-test.
375
0
0
Videnskab