Izračunaj kovarijanciju

Autor: Judy Howell
Datum Stvaranja: 2 Srpanj 2021
Datum Ažuriranja: 1 Srpanj 2024
Anonim
Izračunaj kovarijanciju - Savjeti
Izračunaj kovarijanciju - Savjeti

Sadržaj

Kovarijancija je statistički izračun kako bi se odnos između dva skupa podataka učinio transparentnijim. Na primjer, pretpostavimo da antropolozi proučavaju visinu i težinu stanovništva unutar određene kulture. Za svaku osobu u istraživanju, visina i težina mogu se prikazati s parom podataka (x, y). Te se vrijednosti mogu koristiti u standardnoj formuli za izračunavanje odnosa kovarijance. Ovaj članak prvo objašnjava izračune za određivanje kovarijantnosti skupa podataka. Zatim će se razgovarati o dva druga automatizirana načina određivanja rezultata.

Kročiti

Metoda 1 od 4: Izračunajte kovarijanciju ručno koristeći standardnu ​​formulu

  1. Naučite standardnu ​​formulu kovarijance i njezine dijelove. Standardna formula za izračunavanje kovarijancije je Σ(xjaxprosj)(gjagprosj)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Izgradite tablicu podataka. Prije početka korisno je prikupiti svoje podatke. Stvorite tablicu koja se sastoji od pet stupaca. Svaki stupac morate prijaviti na sljedeći način:
    • x{ displaystyle x}Izračunajte srednju vrijednost x podataka. Ovaj uzorak podataka sadrži 9 brojeva. Da biste pronašli srednju vrijednost, zbrojite ih i zbroj podijelite s 9. To daje rezultat 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Kada ovo podijelite s 9, dobit ćete prosjek 4.89. To je vrijednost koju ćete koristiti kao x (prosjek) za nadolazeće izračune.
    • Izračunajte srednju vrijednost y podataka. Ovaj se stupac y također mora sastojati od 9 podatkovnih točaka koje se podudaraju s x podatkovnih točaka. Odredite prosjek ovih. Za ovaj uzorak skupa podataka ovo postaje 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Podijelite ovaj ukupan rezultat s 9 da biste dobili prosjek 5,44. Upotrijebit ćete 5,44 kao vrijednost y (prosječno) za nadolazeće izračune.
    • Izračunajte vrijednosti (xjaxprosj){ displaystyle (x_ {i} -x _ { text {avg}})}}Izračunajte vrijednosti (gjagprosj){ displaystyle (y_ {i} -y _ { text {prosj}})}}Izračunajte proizvode za svaki redak podataka. Redove posljednjeg stupca popunjavate množenjem brojeva koje ste izračunali u dva prethodna stupca (xjaxprosj){ displaystyle (x_ {i} -x _ { text {avg}})}}Pronađite zbroj vrijednosti u posljednjem stupcu. Ovdje dolazi simbol Σ. Nakon što ste izvršili sve dosadašnje izračune, zbrojite rezultate. Za ovaj uzorak skupa podataka sada biste trebali imati devet vrijednosti u posljednjem stupcu. Zbrojite tih devet brojeva. Dobro pazite je li neki broj pozitivan ili negativan.
      • Zbroj ovog uzorka podataka trebao bi iznositi -64,57. Zapiši ovo ukupno u prostor na dnu stupca. To je vrijednost brojnika standardne formule kovarijance.
    • Izračunaj nazivnik formule kovarijance. Brojilac standardne formule kovarijance vrijednost je koju ste upravo izračunali. Nazivnik je predstavljen s (n-1) i jedan je manji od broja parova podataka u vašem skupu podataka.
      • U ovom primjeru problema postoji devet parova podataka, tako da je n 9. Stoga je vrijednost (n-1) jednaka 8.
    • Podijelite brojilac nazivnikom. Posljednji korak u izračunavanju kovarijancije je dijeljenje brojila, Σ(xjaxprosj)(gjagprosj){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Obratite pažnju na ponavljanje izračuna. Kovarijancija je izračun koji nekoliko puta morate obaviti ručno kako biste shvatili značenje rezultata. Međutim, ako ćete rutinski koristiti kovarijansu za tumačenje podataka, potreban vam je brži i automatiziraniji način za postizanje rezultata. Do sada ste već mogli primijetiti da su se s našim relativno malim skupom podataka od samo devet parova podataka izračuni sastojali od dva sredstva, osamnaest odvojenih oduzimanja, devet množenja, jednog zbrajanja i na kraju drugog dijeljenja. To je 31 relativno mali izračun za pronalaženje rješenja. Putem riskirate da propustite negativne znakove ili pogrešno kopirate rezultate, tako da odgovor više nije točan.
    • Stvorite radni list za izračunavanje kovarijancije. Ako ste upoznati s programom Excel (ili drugim programom za izračunavanje), lako možete stvoriti tablicu za određivanje kovarijancije. Označite naslove pet stupaca kao što ste to učinili za izračune ručno: x, y, (x (i) -x (avg)), (y (i) -y (avg)) i Product.
      • Da biste pojednostavili imenovanje, nazovite treći stupac nekako poput "x razlika", a četvrti stupac "y razlika", sve dok se sjećate značenja podataka.
      • Ako tablica započinje u gornjem lijevom kutu radnog lista, ćelija A1 bit će označena x, dok će se ostale oznake nastaviti do ćelije E1.
    • Unesite podatkovne točke. Unesite vrijednosti podataka u dva stupca x i y. Imajte na umu da je redoslijed točaka podataka važan, pa svaki y morate podudarati s odgovarajućom vrijednošću x.
      • Vrijednosti x započinju u ćeliji A2 i nastavljaju se do broja potrebnih podatkovnih točaka.
      • Vrijednosti y započinju u ćeliji B2 i nastavljaju se do broja potrebnih podatkovnih točaka.
    • Odrediti srednje vrijednosti vrijednosti x i y. Excel vam vrlo brzo izračunava prosjeke. U prvu praznu ćeliju ispod svakog stupca podataka upišite formulu = PROSJEČNO (A2: A ___). Ispraznite prazan prostor brojem ćelije koja odgovara vašoj posljednjoj podatkovnoj točki.
      • Na primjer, ako imate 100 podatkovnih točaka, stanice A2 do A101 se popunjavaju, pa u ćeliju upišite = PROSJEČNO (A2: A101).
      • Za y podatke unesite formulu = PROSJEČNO (B2: B101).
      • Imajte na umu da formula u Excelu započinje znakom "=".
    • Upišite formulu za stupac (x (i) -x (prosj.)). U ćeliju C2 unesite formulu za izračunavanje prvog oduzimanja. Ova formula postaje: = A2 -___. Ispunite prazno mjesto adresom ćelije koja sadrži srednju vrijednost x podataka.
      • Na primjer, od 100 točaka podataka, prosjek će biti u ćeliji A103, tako da vaša formula postaje: = A2-A103.
    • Ponovite formulu za podatkovne točke (y (i) -y (avg)). Slijedeći isti primjer, ulazi u ćeliju D2. Formula postaje: = B2-B103.
    • Upišite formulu za stupac "Proizvod". U peti stupac unesite formulu za izračunavanje umnoška dviju prethodnih stanica u ćeliju E2. To tada postaje: = C2 * D2.
    • Kopirajte formule da popunite tablicu. Do sada ste programirali samo prvih nekoliko točaka podataka u retku 2. Pomoću miša označite stanice C2, D2 i E2. Postavite pokazivač na mali okvir u donjem desnom kutu dok se ne pojavi znak plus. Pritisnite i držite tipku miša i povucite miš prema dolje da biste proširili odabir i popunili cijelu tablicu podataka. Ovaj će korak automatski kopirati tri formule iz ćelija C2, D2 i E2 u cijelu tablicu. Tablicu treba automatski popuniti svim izračunima.
    • Programirajte zbroj posljednjeg stupca. Treba vam zbroj stavki u stupcu "Proizvod". U praznu ćeliju neposredno ispod posljednje točke podataka u tom stupcu upišite formulu: = SUM (E2: E ___). Ispunite prazno mjesto adresom ćelije posljednje točke podataka.
      • U primjeru sa 100 točaka podataka, ova formula ulazi u ćeliju E103. Tip: = SUM (E2: E102).
    • Odrediti kovarijanciju. Excel također može izvršiti konačni izračun umjesto vas. Posljednji izračun u ćeliji E103 u našem primjeru predstavlja brojnik formule kovarijance. Odmah ispod te ćelije upišite formulu: = E103 / ___. Ispraznite prazan prostor s brojem podatkovnih točaka koje imate. U našem primjeru to je 100. Rezultat je kovarijancija vaših podataka.

Metoda 3 od 4: Korištenje internetskih kalkulatora kovarijance

  1. Pretražite kalkulatore kovarijacije na mreži. Razne škole, tvrtke ili drugi izvori imaju web stranice koje za vas vrlo lako izračunavaju vrijednosti kovarijance. Upotrijebite izraz za pretraživanje "kalkulator kovarijance" u tražilici.
  2. Unesite svoje podatke. Pažljivo pročitajte upute na web mjestu kako biste bili sigurni da ste ispravno unijeli podatke. Važno je da vaši parovi podataka budu u redu, jer će u suprotnom generirani rezultat biti pogrešna kovarijancija. Web stranice imaju različite stilove unosa podataka.
    • Na primjer, na web mjestu http://ncalculators.com/statistics/covariance-calculator.htm postoji vodoravni okvir za unos x vrijednosti i drugi vodoravni okvir za unos y vrijednosti. Svoje podatke morate unijeti odvojeni zarezima. Dakle, x podatak izračunat ranije u ovom članku tada treba unijeti kao 1,3,2,5,8,7,12,2,4. Podaci o y kao 8,6,9,4,3,3,2,7,7.
    • Na drugoj web lokaciji, https://www.thecalculator.co/math/Covariance-Calculator-705.html, od vas će se tražiti da u prvi okvir unesete x podatke. Podaci se unose okomito, s jednom stavkom u retku. Stoga unos na ovoj stranici izgleda ovako:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Izračunajte svoje rezultate. Atraktivna stvar kod ovih mrežnih izračuna je da nakon unosa podataka obično trebate samo kliknuti gumb "Izračunaj" i rezultati će se automatski pojaviti. Većina web mjesta pružit će vam srednje izračune x (prosjek), y (prosjek) i n.

Metoda 4 od 4: Tumačenje rezultata kovarijance

  1. Potražite pozitivnu ili negativnu vezu. Kovarijancija je jedan statistički broj koji označava odnos između jednog skupa podataka i drugog. U primjeru spomenutom u uvodu mjere se visina i težina. Očekivali biste da će se kako ljudi rastu njihova težina također povećavati, što dovodi do pozitivnog kovarijantnog pogleda. Sljedeći primjer: Pretpostavimo da se prikupljaju podaci koji pokazuju koliko sati netko trenira golf i rezultat koji postiže. U ovom slučaju očekujete negativnu kovarijanciju, što znači da će se povećanjem broja sati treninga rezultat golfa smanjivati. (U golfu je bolji niži rezultat).
    • Razmotrite gore izračunate uzorke podataka. Rezultirajuća kovarijancija je -8,07. Znak minus znači da se s porastom vrijednosti x vrijednosti y smanjuju. Možete vidjeti da je to istina gledajući neke vrijednosti. Na primjer, x vrijednosti 1 i 2 odgovaraju y vrijednostima 7, 8 i 9. x vrijednosti 8 i 12 povezane su s y vrijednostima 3, odnosno 2 .
  2. Protumačite veličinu kovarijance. Ako je broj kovarijancijskih rezultata velik, bilo velik pozitivan broj ili velik negativan broj, tada to možete protumačiti kao dva podatkovna elementa koja su čvrsto povezana, bilo na pozitivan ili negativan način.
    • Kovarijancija -8,07 skupa podataka uzorka prilično je velika. Imajte na umu da se podaci kreću od 1 do 12. Dakle, 8 je prilično velik broj. To ukazuje na prilično snažnu vezu između skupova podataka x i y.
  3. Shvatite nedostatak veze. Ako je vaš rezultat kovarijancija jednaka ili vrlo blizu 0, možete zaključiti da podatkovne točke nisu povezane. Odnosno, povećanje jedne vrijednosti može, ali ne mora rezultirati povećanjem druge vrijednosti. Ta su dva pojma povezana gotovo slučajno.
    • Pretpostavimo da veličinu cipela povežete s ocjenama na ispitu. Budući da postoji toliko čimbenika koji utječu na ocjenu studenta, može se očekivati ​​rezultat kovarijance blizu 0. To ukazuje na to da gotovo nema veze između dviju vrijednosti.
  4. Pogledajte odnos grafički. Da biste vizualno razumjeli kovarijanciju, svoje podatkovne točke možete nacrtati na x, y grafikonu. Kada to učinite, vrlo lako biste mogli vidjeti da se točke, iako ne baš u ravnoj liniji, teže približavati klasteru dijagonalnom linijom od gore lijevo dolje desno. Ovo je opis negativne kovarijancije. Također možete vidjeti da je vrijednost kovarijance jednaka -8,07. To je prilično velik broj u usporedbi s podacima. Veliki broj sugerira da je kovarijancija prilično jaka, što možete zaključiti iz linearnog oblika točaka podataka.
    • Da biste to ponovno prošli, pročitajte članke o crtanju točaka u koordinatnom sustavu na wikiHow.

Upozorenja

  • Kovarijancija ima ograničenu primjenu u statistici. Često je korak prema izračunavanju koeficijenata korelacije ili drugih koncepata. Budite oprezni s pretjerano podebljanim interpretacijama na temelju kovarijantne ocjene.