Miten Hylkää Outliers Data

kerätyt tiedot kokeissa, tutkimuksia ja muita tiedonkeruuseen menettelyjä on yleensä edellyttää jonkin verran satunnaisuutta.Joissakin tapauksissa yksittäiset mittaukset tai vastauksia voi tuntua kaukana toivottua tulosta;nämä ovat harha.Kun olet törmännyt harha, kannattaa tarkistaa se määrittää, jos pitäisi hylätä sen kokonaan.

Ohjeet

  1. Tarkasta harha olla varma, että se sopii laadullisesti muun datan.Esimerkiksi, jos kysyt 20 ihmistä mitata leveys penniäkään, mutta yksi heistä mitatut leveys neljäsosaa, saatat olla harha tiedoissa.Sinun pitäisi hylätä tämä harha, koska se ei sovi laadullisesti kanssa kokeilu.

  2. Käytä Dixonin Q-testi, jos et hylkää harha sen perusteella vaiheessa 1. Q-testi on kvantitatiivinen mitta tilastoissa merkityksestä tietyn arvon suhteessa joukko tietoja.

  3. Selvitä luotettavuustasolla Q-testi.Jos haluat olla 90 prosenttisen varma, että harha pitäisi tai ei pitäisi hylätä, valitse luottamustasolla 90 prosenttia.

  4. Etsi kriittinen Q-arvo (Qcrit) käyttäen taulukon.Sinun

    täytyy tietää määrää arvojen datajoukon (esimerkiksi N) ja luotettavuustasolla että valitset vaiheessa 3.

  5. Asettele datajoukosta nousevassa järjestyksessä.Siten jokainen arvo joukko, X (i), järjestää tiedot niin, että X (1) & lt;X (2) & lt;... & Lt;X (N - 1) & lt;X (n).

  6. Laske kokeellinen Q-arvo (Qexp) ja poikkeavien.Yhden harha, harha on joko X (1) tai X (N) tiedot järjestelyssä vaiheesta 5. vastaavat Q-arvot näissä kahdessa tapauksessa ovat [X (2) - X (1)] / [X (N) - X (1)] ja [x (n) - X (N - 1)] / [x (n) - X (1)].

  7. Vertaa kokeellinen Q-arvo vaiheesta 6 kriittisen Q-arvo vaiheesta 4. Jos Qexp on suurempi kuin Qcrit, sinun pitäisi hylätä harha.Jos Qexp on alle Qcrit, niin kannattaa pitää harha tiedoissa.Sinun hyväksymisestä tai hylkäämisestä harha on luottamustasolla mukaan, mitä olet valinnut vaiheessa 3 (esimerkiksi, olet 90 prosenttisen varma, että sinun pitäisi hylätä outlier).

Vinkkejä & amp;Varoitukset

  • Korkeammat luottamusta tasoilla johtaa korkeampiin kriittisiä Q-arvot.Tämän seurauksena jos haluat olla varma, että sinun pitäisi hylätä tietty harha, että harha on enemmän ilmeisesti paikallaan suhteessa muuhun tietojen.
  • Dixonin Q-testi toimii parhaiten pienestä otoksesta.Suurempi otoskoko voi vaatia muita tilastoja testejä.
  • Jos sinulla on useita poikkeavuuksien sinun tulee käyttää eri tilastoissa testi kuin Q-testi.
65
0
0
Tiede