Kako procijeniti statističku značajnost

Autor: Randy Alexander
Datum Stvaranja: 2 Travanj 2021
Datum Ažuriranja: 26 Lipanj 2024
Anonim
P-values and significance tests | AP Statistics | Khan Academy
Video: P-values and significance tests | AP Statistics | Khan Academy

Sadržaj

Ispitivanje hipoteze vodi se statističkom analizom. Statistički značajno pouzdanje izračunava se pomoću vrijednosti p - koja ukazuje na vjerojatnost promatranog rezultata kada je određena (nulta hipoteza) istinita. Ako je p-vrijednost manja od razine značajnosti (obično 0,05), eksperimentator može zaključiti da postoji dovoljno dokaza da se odbaci nulta hipoteza i prizna inverzna hipoteza. Pomoću jednostavnog t-testa možete izračunati p-vrijednost i odrediti značaj između dvije različite skupine podataka.

Koraci

1. dio od 3: Postavite svoje eksperimente

  1. Odredite svoju hipotezu. Prvi korak u procjeni statističke značajnosti je identificiranje pitanja na koja treba odgovoriti i izjašnjavanje o vašoj hipotezi. Hipoteza je iskaz empirijskih podataka i mogućih odstupanja u populaciji. Svaki eksperiment ima nultu i inverznu hipotezu. Općenito, usporedit ćete dvije skupine da biste vidjeli jesu li iste ili različite.
    • Općenito, hipoteza nije (H0) potvrđuju da ne postoji razlika između dviju skupina podataka. Primjer: Učenici koji su materijal pročitali prije nastave ne dobivaju bolje završne ocjene.
    • Obrnuta hipoteza (Ha) suprotno je nultoj hipotezi i izjava je koju pokušavate potkrijepiti svojim empirijskim podacima. Na primjer: Studenti koji su materijal pročitali prije nastave zapravo dobivaju bolje završne ocjene.

  2. Odaberite razinu značajnosti da biste odredili stupanj razlike koja se u podacima može smatrati značajnom. Razina značajnosti (poznata i kao alfa) prag je koji odaberete za određivanje značenja. Ako je vrijednost p manja ili jednaka određenoj razini značajnosti, podaci se smatraju statistički značajnima.
    • Kao opće pravilo, razina značajnosti (ili alfa) obično se bira na razini 0,05 - što znači da je vjerojatnost uočavanja razlike koja se vidi u podacima slučajna samo 5%.
    • Što su veća razina pouzdanosti (i prema tome, što je niža p-vrijednost), to su rezultati značajniji.
    • Ako je potrebno više povjerenja, spustite vrijednost p na 0,01. Niska vrijednost p često se koristi u proizvodnji za otkrivanje nedostataka na proizvodu. Visok stupanj pouzdanosti presudan je za prihvaćanje da će svaki dio funkcionirati kako treba.
    • Za većinu pokusa temeljenih na hipotezama prihvatljiva je razina značajnosti od 0,05.

  3. Odlučite hoćete li koristiti jednostrani ili dvostrani test. Jedna od pretpostavki t-testa je da su vaši podaci u normalnoj distribuciji. Normalna raspodjela činit će zvonastu krivulju sa centriranom većinom promatranja. T-test je matematički test koji provjerava padaju li vaši podaci na vanjsku stranu normalne raspodjele, iznad ili ispod, u "gornjem" dijelu krivulje.
    • Ako niste sigurni jesu li podaci iznad ili ispod kontrolne skupine, upotrijebite dvostrani test. Omogućuje vam provjeru značaja u oba smjera.
    • Ako znate kakav je očekivani smjer vaših podataka, upotrijebite jednostrani test. U gornjem primjeru očekujete da će se bodovi učenika poboljšati. Stoga koristite jednostrani test.

  4. Analizom sile odredite veličinu uzorka. Sila testa je sposobnost promatranja očekivanog rezultata s danom veličinom uzorka. Uobičajeni prag sile (ili β) je 80%. Analiza sile može biti prilično komplicirana bez nekih preliminarnih podataka, jer su vam potrebne neke informacije o očekivanoj srednjoj vrijednosti između skupina i njihovim standardnim odstupanjima. Pomoću mrežne analize sile odredite optimalnu veličinu uzorka za svoje podatke.
    • Istraživači često izvode malu premisu kako bi informirali analizu sile i odlučili veličinu uzorka potrebnu za veliko i sveobuhvatno istraživanje.
    • Ako ne postoji način za složeno istraživanje premisa, procijenite moguću sredinu na temelju čitanja članaka i istraživanja koje su drugi pojedinci možda radili. Može vam dati dobar početak u određivanju veličina uzorka.
    oglas

Dio 2 od 3: Izračunajte standardno odstupanje

  1. Odredite formulu za standardno odstupanje. Standardno odstupanje mjeri rasipanje podataka. Pruža vam informacije o identitetu svake točke podataka u uzorku. Kada prvi put započinjemo, jednadžbe mogu izgledati prilično komplicirano. Međutim, koraci u nastavku pomoći će vam da lakše razumijete postupak izračuna. Formula je s = √∑ ((xja - µ) / (N - 1)).
    • s je standardno odstupanje.
    • ∑ označava da ćete morati sabrati sva prikupljena zapažanja.
    • xja svaki predstavlja vašu vrijednost podataka.
    • µ je srednja vrijednost podataka za svaku skupinu.
    • N je ukupan broj promatranja.
  2. Prosječni broj opažanja u svakoj skupini. Da biste izračunali standardno odstupanje, prvo morate izračunati srednju vrijednost opažanja za svaku pojedinu skupinu. Ovu vrijednost simbolizira grčko slovo mu ili µ. Da biste to učinili, jednostavno dodajte zapažanja i podijelite s ukupnim brojem opažanja.
    • Na primjer, da bismo pronašli prosječni rezultat grupe koja je čitala dokument prije nastave, pogledajmo neke podatke. Radi jednostavnosti koristit ćemo skup podataka od 5 točaka: 90, 91, 85, 83 i 94 (na skali od 100 točaka).
    • Zbroji sva zapažanja: 90 + 91 + 85 + 83 + 94 = 443.
    • Podijelite gornji zbroj s brojem promatranja N (N = 5): 443/5 = 88,6.
    • Prosječna ocjena za ovu skupinu je 88,6.
  3. Oduzmite prosjek od svake promatrane vrijednosti. Sljedeći korak uključuje dio (xja - µ) jednadžbe. Od svake promatrane vrijednosti oduzmite prosječnu vrijednost. S gornjim primjerom imamo pet oduzimanja.
    • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) i (94 - 88,6).
    • Izračunata vrijednost je 1,4; 2,4; -3,6; -5,6 i 5,4.
  4. Gore navedene razlike poravnajte i zbrojite. Svaka nova vrijednost koja je upravo izračunata sada će biti na kvadrat. Ovdje će se ukloniti i negativni znak. Ako se nakon ovog koraka ili na kraju izračuna pojavi negativni znak, možda ste zaboravili napraviti gornji korak.
    • U našem primjeru sada ćemo raditi s 1,96; 5,76; 12,96; 31,36 i 29,16.
    • Zbrojite ove kvadrate: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Podijelite s ukupnim brojem opažanja minus 1. Dijeljenje s N - 1 pomaže nadoknaditi izračun koji se ne vrši na populaciji u cjelini, već se temelji na uzorku svih učenika.
    • Oduzmi: N - 1 = 5 - 1 = 4
    • Podjela: 81,2 / 4 = 20,3
  6. Dobijte kvadratni korijen. Nakon što podijelite s brojem opažanja minus 1, uzmite kvadratni korijen dobivene vrijednosti. Ovo je zadnji korak u izračunavanju standardne devijacije. Neki statistički programi pomoći će vam u izvođenju ovog izračuna nakon uvoza izvornih podataka.
    • S gornjim primjerom, standardno odstupanje ocjene na kraju semestra učenika koji čitaju dokument prije nastave je: s = √20,3 = 4,51.
    oglas

Dio 3 od 3: Određivanje statističke značajnosti

  1. Izračunajte varijancu između vaše dvije skupine promatranja. Do ovog trenutka, primjer se bavio samo jednom skupinom zapažanja. Da biste usporedili dvije skupine, očito su vam potrebni podaci iz obje. Izračunajte standardno odstupanje druge skupine promatranja i upotrijebite ga za izračun varijance između dvije eksperimentalne skupine. Formula za izračunavanje varijance je: sd = √ ((s1/ N1) + (s2/ N2)).
    • Sd je varijansa između skupina.
    • S1 je standardno odstupanje skupina 1 i N1 je veličina grupe 1.
    • S2 je standardno odstupanje skupina 2 i N2 je veličina grupe 2.
    • U našem primjeru recimo da podaci iz skupine 2 (učenici koji nisu čitali tekst prije nastave) imaju veličinu 5 i standardno odstupanje 5,81. Varijansa je:
      • Sd = √ ((s1) / N1) + ((s2) / N2))
      • Sd = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Izračunajte t-rezultat podataka. T-statistika omogućuje vam pretvaranje podataka u oblik koji je usporediv s ostalim podacima. Vrijednost t također vam omogućuje provođenje t-testa, testa koji vam omogućuje izračunavanje vjerojatnosti statistički značajne razlike između dviju skupina. Formula za izračunavanje t-statistike je: t = (µ1 – µ2) / Sd.
    • µ1 je prosjek prve skupine.
    • µ2 je prosjek druge skupine.
    • Sd je varijansa između opažanja.
    • Veću srednju vrijednost upotrijebite kao µ1 kako ne bi došlo do negativne t-statistike.
    • Za naš primjer, pretpostavimo da je primijećena srednja vrijednost za skupinu 2 (koja nije pročitala prethodni članak) 80. T-rezultat je: t = (µ1 – µ2) / Sd = (88,6 – 80)/3,29 = 2,61.
  3. Odredite stupanj slobode uzorka. Kada se koristi t-statistika, stupnjevi slobode određuju se na temelju veličine uzorka. Zbrojite broj opažanja za svaku skupinu, a zatim oduzmite dva. U gornjem primjeru, stupanj slobode (d.f.) je 8, jer u prvoj skupini ima 5 uzoraka, a u drugoj 5 uzoraka ((5 + 5) - 2 = 8).
  4. Koristite tablicu t da biste procijenili značaj. Tablice t-vrijednosti i stupnjevi slobode mogu se naći u standardnoj statistici ili na mreži. Pronađite redak koji sadrži stupnjeve slobode podataka i p-vrijednost koja odgovara t-statistici koju imate.
    • Sa stupnjevima slobode 8 i t = 2,61, vrijednost p za jednostrani test iznosi između 0,01 i 0,025. Budući da je odabrana razina značajnosti manja ili jednaka 0,05, naši su podaci statistički značajni. Ovim podacima odbacujemo nultu hipotezu i prihvaćamo obrnutu hipotezu: učenici koji su materijal pročitali prije nastave imaju veće konačne ocjene.
  5. Razmislite o provođenju daljnjih istraživanja. Mnogi istraživači izvode temeljne studije s nekoliko mjernih podataka kako bi razumjeli kako dizajnirati veću studiju. Provođenje drugih istraživanja s više mjernih podataka povećat će vaše povjerenje u vaše zaključke. oglas

Savjet

  • Statistika je veliko i složeno područje. Položite test statističke hipoteze na srednjoj školi ili sveučilištu (ili viši) da biste razumjeli statističku značajnost.

Upozorenje

  • Ova se analiza usredotočuje na t-test za provjeru razlike između dvije standardne populacije distribucije. Ovisno o složenosti podataka, možda će vam trebati još jedan statistički test.