Sådan Beregn p-værdier i Chi Square

Genetikere bruger ofte chi -square test . Thomas Northcut / Digital Vision / Getty Images

Den chi-kvadrat-test er et værdifuldt statistisk værktøj, der anvendes i eksperimentelle discipliner, såsom biologi, psykologi og økonomi.Slutresultatet af en chi-square test kaldes p-værdien, som kan fortælle en eksperimentator hvordan gyldigt hans hypotese var, eller hvis der var en sammenhæng mellem to variable, han undersøgte.Beregning af p-værdi er et spørgsmål om at tilslutte data i en formel, og kigger op p-værdien på et diagram.Med praksis, kan det blive relativt let at gøre.

Formålet med en Chi-Square test

  • En chi-square test er en statistisk test, der er designet til at fortælle en eksperimentator hvordan forskellige to sæt data er, og derfor sandsynligheden for, at noglekendt eller ukendt faktor forårsager dem til at være anderledes.Chi-square tests kræver kategoriske data : et sæt som afspejler tallene forsøgslederen forventes i hver kategori og ét sæt, der afspejler antallet forsøgslederen observeret i hver kategori under eks

    perimentet.Slutresultatet af chi-square test - den p-værdi - fortæller dig, sandsynligheden for, at forskellen mellem den forventede og observerede data skyldes tilfældig chance.

Beregning af Chi-Square Statistik

  • Antag en genetiker studerer arv af farve i en bestemt blomst.Genetiker vil udvikle en hypotese, der vil forudsige forholdet af blomster i forskellige farver i et sæt af afkom.For eksempel kan genetiker hypotese forudser, at i en ny generation af 100 blomsterplanter, 75 bør være rød og 25 skal være hvidt.Men da hun tæller blomsterne i den nye generation, 71 er røde og 29 er hvide.Skulle hun acceptere eller afvise hendes hypotese?Med andre ord, er hendes observerede værdier for forskellige fra hendes forventede værdier til at acceptere hendes hypotese, eller er de tæt nok.En chi-square test vil fortælle hende.

Beregning af Chi-square Statistik

  • Først trække den forventede værdi for hver kategori fra den observerede værdi for hver kategori og firkantet hvert resultat.

    Røde blomster = (71-75) ^ 2 = -4 ^ 2 = 16
    hvide blomster = (29-25) ^ 2 = 4 ^ 2 = 16

    Dernæst kløft hvert resultat vedden forventede værdi for hver kategori.

    Røde blomster = 16 ÷ 75 = 0,21
    hvide blomster = 16 ÷ 25 = 0,64

    Endelig summen resultaterne.

    Chi-kvadrat = 0,21 + 0,64 = 0,85

    Den chi-kvadrat statistik er en normaliseret mål for, hvor forskelligt de observerede og forventede værdier er.Jo større værdien er, jo større forskellen mellem observerede og forventede data.

Fastsættelse af P-værdien

  • Fra data, der følger en normalfordeling - tror klokke kurve - du kan beregne sandsynligheden for at opnå en given chi-square værdi ved tilfældig chance under forudsætning af de forventede værdier repræsenterer hvad skulle være sket.Det første skridt i at opnå en p-værdi er at bestemme frihedsgrader i dataene.For en goodness of fit test som eksempel blot trække 1 fra antallet af kategorier, N .(I en test for uafhængighed, der analyserer flere variabler, der er repræsenteret i en to-vejs bord, grader af frihed = (tabelrækker -1) × (tabelkolonner - 1), men det er uden for rammerne af denne artikel)

    df= N - 1 = 2 - 1 = 1

    Du kan finde p-værdien ved at matche de frihedsgrader række med den ønskede p-værdi kolonne på en chi-kvadrat fordeling bord.Den typiske p-værdi standard for godhed fit tests er 0,05 .Det betyder, at du kan acceptere en hypotese, så længe p-værdien er over 0,05.Ser man på fordelingen bord til 1 frihedsgrad og en p-værdi på 0,05, chi-square værdi 3.84 .Det betyder, at enhver chi-square værdi mindre end 3,84 betyder, at du kan acceptere den hypotese, at givet de forventede data.Derfor kan genetiker i eksemplet acceptere hendes hypotese da hendes chi-square-værdien var 0,85.

Ressourcer

  • Pennsylvania State: Chi-square Distribution Tabel
488
0
1
Gymnasium