Načini izračunavanja varijance

Autor: Robert Simon
Datum Stvaranja: 21 Lipanj 2021
Datum Ažuriranja: 1 Srpanj 2024
Anonim
FORMULE ZA IZRAČUNAVANJE VAŠEG MAKSIMUMA (1 REP MAX)
Video: FORMULE ZA IZRAČUNAVANJE VAŠEG MAKSIMUMA (1 REP MAX)

Sadržaj

Varijansa mjeri disperziju skupa podataka. Vrlo je korisno u izradi statističkih modela: mala varijanca može biti pokazatelj da opisujete slučajnu pogrešku ili šum umjesto osnovne veze u podacima. Ovim člankom wikiHow vas uči kako izračunati varijancu.

Koraci

Metoda 1 od 2: Izračunajte varijancu uzorka

  1. Napišite svoj uzorak podataka. U većini slučajeva statističari imaju podatke samo na uzorku ili podskupini populacije koju proučavaju. Primjerice, umjesto opće analize "troškova svih automobila u Njemačkoj", statističar bi mogao pronaći trošak slučajnog uzorka od nekoliko tisuća automobila. Statističar može koristiti ovaj uzorak kako bi dobio dobru procjenu troškova automobila u Njemačkoj. Međutim, vjerojatnije je da se neće točno podudarati sa stvarnim brojevima.
    • Na primjer: Analizirajući broj muffina prodanih dnevno u kafiću, uzeli ste slučajni šestodnevni uzorak i dobili sljedeće rezultate: 38, 37, 36, 28, 18, 14, 12, 11, 10,7, 9,9. Ovo je uzorak, a ne populacija, jer nemate podataka za svaki dan kada je trgovina otvorena.
    • Ako svaki Točke podataka u masteru, idite na donju metodu.

  2. Zapišite formulu varijance uzorka. Odstupanje skupa podataka ukazuje na stupanj disperzije točaka podataka. Što je varijansa bliža nuli, to su podatkovne točke bliže grupirane. Kada radite s uzorcima skupova podataka, koristite sljedeću formulu za izračunavanje varijance:
    • = /(n - 1)
    • je varijanca. Varijansa se uvijek izračunava u kvadratnim jedinicama.
    • predstavlja vrijednost u vašem skupu podataka.
    • ∑, što znači "zbroj", govori vam da izračunate sljedeće parametre za svaku vrijednost, a zatim ih zbrojite.
    • x̅ je srednja vrijednost uzorka.
    • n je broj podatkovnih točaka.

  3. Izračunati srednju vrijednost uzorka. Simbol x̅ ili "x-horizontal" koristi se za označavanje srednje vrijednosti uzorka. Izračunajte kao i bilo koji prosjek: zbrojite sve podatkovne točke i podijelite ih s brojem bodova.
    • Na primjer: Prvo zbrojite svoje podatkovne točke: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Dalje, rezultat podijelite s brojem podatkovnih točaka, u ovom slučaju šest: 84 ÷ 6 = 14.
      Srednja vrijednost uzorka = x̅ = 14.
    • Srednju vrijednost možete smatrati "središnjom točkom" podataka. Ako su podaci usredotočeni oko srednje vrijednosti, varijansa je mala. Ako su raspršeni daleko od srednje vrijednosti, varijansa je velika.

  4. Oduzmite srednju vrijednost iz svake točke podataka. Sada je vrijeme za izračun - x̅, gdje je svaka točka u vašem skupu podataka. Svaki rezultat ukazat će na odstupanje od srednje vrijednosti svake odgovarajuće točke ili, jednostavnije rečeno, na udaljenost od nje do srednje vrijednosti.
    • Na primjer:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • Vrlo je lako provjeriti svoje izračune, jer se rezultati moraju zbrojiti na nulu. To je zato što su srednji prosjek negativni rezultati (udaljenost od srednje vrijednosti do malih brojeva). pozitivni rezultati (udaljenost od srednje vrijednosti do većih brojeva) u potpunosti se eliminiraju.
  5. Zakucajte sve rezultate. Kao što je gore napomenuto, trenutni popis odstupanja (- x̅) ima zbroj nule, što znači da će "prosječno odstupanje" također uvijek biti nula i ništa se ne može reći o raspršivanju podataka. Da bismo riješili taj problem, pronalazimo kvadrat svakog odstupanja. Zahvaljujući tome, svi su pozitivni brojevi, negativne vrijednosti i pozitivne vrijednosti više se ne poništavaju i zbroju daju nulu.
    • Na primjer:
      (- x)
      - x)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Sada imate (- x̅) za svaku podatkovnu točku u uzorku.
  6. Pronađite zbroj kvadrata vrijednosti. Sada je vrijeme za izračun cijelog brojnika formule: ∑. Veliki ciklo, ∑, zahtijeva da za svaku vrijednost dodate sljedeću vrijednost elementa. Izračunali ste (- x̅) za svaku vrijednost u uzorku, pa sve što morate učiniti je samo zbrajati rezultate.
    • Na primjer: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Podijelite s n - 1, gdje je n broj podatkovnih točaka. Davno, pri izračunavanju varijance uzorka, statističari su dijelili samo n. Ta će vam podjela dati srednju vrijednost odstupanja na kvadrat, koja točno odgovara varijansi tog uzorka. Međutim, imajte na umu da je uzorak samo procjena veće populacije. Ako uzmete još jedan slučajni uzorak i napravite isti izračun, dobit ćete drugačiji rezultat. Ispostavilo se da dijeljenje s n-1 umjesto n daje bolju procjenu varijance veće populacije - do koje vam je zaista stalo. Ova je korekcija toliko uobičajena da je sada prihvaćena definicija varijance uzorka.
    • Na primjer: U uzorku postoji šest točaka podataka, pa je n = 6.
      Varijansa uzorka = 33,2
  8. Razumijevanje varijance i standardne devijacije. Imajte na umu da se, budući da u formuli postoje potencijali, varijanca mjeri u kvadratnim jedinicama izvornih podataka. To je vizualno zbunjujuće. Umjesto toga, često je standardno odstupanje vrlo korisno. Ali nema smisla gubiti napor, jer je standardno odstupanje određeno kvadratnim korijenom varijance. Zbog toga se varijanca uzorka zapisuje kao, a standardna devijacija uzorka je.
    • Na primjer, standardno odstupanje gornjeg uzorka = s = √33,2 = 5,76.
    oglas

Metoda 2 od 2: Izračunavanje varijance populacije

  1. Počevši od skupa matičnih podataka. Izraz "stanovništvo" koristi se za označavanje svih relevantnih opažanja. Na primjer, ako istražujete dob stanovnika Hanoja, vaša će ukupna populacija uključivati ​​dob svih pojedinaca koji žive u Hanoju. Obično biste stvorili proračunsku tablicu za velik skup podataka poput ovog, ali evo manjeg primjera skupa podataka:
    • Na primjer: U sobi akvarija nalazi se točno šest akvarija. Ovih šest spremnika sadrži sljedeći broj riba:





  2. Zapišite formulu za ukupnu varijansu. Budući da populacija sadrži sve potrebne podatke, ova formula daje nam točnu varijansu populacije. Da bi je razlikovali od varijance uzorka (koja je samo procjena), statističari koriste druge varijable:
    • σ = /n
    • σ = varijansa uzorka. Ovo je normalno kvadratna kobasica. Varijansa se mjeri u kvadratnim jedinicama.
    • predstavlja element u vašem skupu podataka.
    • Element u ∑ izračunava se za svaku vrijednost, a zatim zbraja.
    • μ je ukupna srednja vrijednost.
    • n je broj podatkovnih točaka u populaciji.
  3. Pronađite srednju vrijednost stanovništva. Kada se analizira populacija, simbol μ ("mu") predstavlja aritmetičku sredinu. Da biste pronašli srednju vrijednost, zbrojite sve podatkovne točke, a zatim podijelite s brojem točaka.
    • O srednjem značite kao "prosječnom", ali budite oprezni, jer ta riječ ima mnogo matematičkih definicija.
    • Na primjer: srednja vrijednost = μ = = 10,5
  4. Oduzmite srednju vrijednost iz svake točke podataka. Točke podataka bliže srednjoj vrijednosti imaju razliku bližu nuli. Ponovite problem oduzimanja za sve točke podataka i vjerojatno ćete početi osjećati raspršenost podataka.
    • Na primjer:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Kvadrirajte svaki znak. U ovom će trenutku neki rezultati dobiveni u prethodnom koraku biti negativni, a neki pozitivni.Ako vizualizirate podatke na izomorfnoj liniji, ove dvije stavke predstavljaju brojeve lijevo i desno od srednje vrijednosti. To ne bi koristilo izračunavanju odstupanja, jer bi se ove dvije skupine međusobno poništile. Umjesto toga, kvadrat ih sve, tako da su svi pozitivni.
    • Na primjer:
      (- μ) za svaku vrijednost od ja traje od 1 do 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Pronađite prosjek rezultata. Sada imate vrijednost za svaku podatkovnu točku, povezanu (ne izravno) s udaljenošću te podatkovne točke od srednje vrijednosti. Prosječno ih zbrojite i podijelite s brojem vrijednosti koje imate.
    • Na primjer:
      Ukupna varijansa = 24,25
  7. Kontakt recept. Ako niste sigurni kako se to uklapa u formulu navedenu na početku metode, zapišite cijeli problem rukom i nemojte ga skraćivati:
    • Nakon pronalaska razlike od srednje vrijednosti i izračunavanja kvadrata, imate (- μ), (- μ) i tako dalje do (- μ), gdje je zadnja točka podataka. u skupu podataka.
    • Da biste pronašli prosjek ovih vrijednosti, zbrojite ih i podijelite s n: ((- μ) + (- μ) + ... + (- μ)) / n
    • Nakon što ste prepisali brojnik sa sigmoidnim zapisom, imate /n, varijansa formule.
    oglas

Savjet

  • Budući da je varijansu teško protumačiti, ova se vrijednost često izračunava kao početna točka za pronalaženje standardne devijacije.
  • Upotreba "n-1" umjesto "n" u nazivniku je tehnika koja se naziva Besselova korekcija. Uzorak je samo procjena kompletne populacije, a srednja vrijednost uzorka ima određenu pristranost koja odgovara toj procjeni. Ova korekcija uklanja gornju pristranost. To se tiče činjenice da je jednom nabrojano n - 1 podatkovnih točaka, posljednja tačka n bila konstanta, jer su se za izračunavanje srednje vrijednosti uzorka (x̅) u formuli varijance koristile samo određene vrijednosti.