Kako izračunati koeficijent linearne korelacije

Autor: Eric Farmer
Datum Stvaranja: 7 Ožujak 2021
Datum Ažuriranja: 1 Srpanj 2024
Anonim
Koeficijent korelacije 01 Pearsonov koeficijent korelacije
Video: Koeficijent korelacije 01 Pearsonov koeficijent korelacije

Sadržaj

Koeficijent korelacije (ili koeficijent linearne korelacije) označava se kao "r" (u rijetkim slučajevima kao "ρ") i karakterizira linearnu korelaciju (to jest odnos koji je određen nekom vrijednošću i smjerom) dviju ili više varijabli. Vrijednost koeficijenta nalazi se između -1 i +1, odnosno korelacija može biti i pozitivna i negativna. Ako je koeficijent korelacije -1, postoji savršena negativna korelacija; ako je koeficijent korelacije +1, postoji savršena pozitivna korelacija. Inače, postoji pozitivna korelacija između dvije varijable, negativna korelacija ili nema korelacije. Koeficijent korelacije može se izračunati ručno, s besplatnim mrežnim kalkulatorima ili s dobrim grafičkim kalkulatorom.

Koraci

Metoda 1 od 4: Ručni izračun koeficijenta korelacije

  1. 1 Prikupiti podatke. Prije nego počnete izračunavati koeficijent korelacije, proučite ove parove brojeva. Bolje ih zapisati u tablicu koja se može postaviti okomito ili vodoravno. Svaki redak ili stupac označite s "x" i "y".
    • Na primjer, s obzirom na četiri para vrijednosti (brojeva) varijabli "x" i "y". Možete stvoriti sljedeću tablicu:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Izračunajte aritmetičku sredinu "x". Da biste to učinili, zbrojite sve vrijednosti x, a zatim rezultat podijelite s brojem vrijednosti.
    • U našem primjeru postoje četiri vrijednosti za varijablu "x". Da biste izračunali aritmetičku sredinu "x", dodajte ove vrijednosti, a zatim zbroj podijelite sa 4. Izračuni se zapisuju na sljedeći način:
    • μx=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μx=12/4{ displaystyle mu _ {x} = 12/4}
    • μx=3{ displaystyle mu _ {x} = 3}
  3. 3 Pronađi aritmetičku sredinu "y". Da biste to učinili, slijedite iste korake, odnosno zbrojite sve vrijednosti y, a zatim zbroj podijelite s brojem vrijednosti.
    • U našem primjeru date su četiri vrijednosti varijable "y". Dodajte ove vrijednosti, a zatim zbroj podijelite sa 4. Izračuni će biti zapisani na sljedeći način:
    • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μy=16/4{ displaystyle mu _ {y} = 16/4}
    • μy=4{ displaystyle mu _ {y} = 4}
  4. 4 Izračunajte standardnu ​​devijaciju "x". Nakon izračuna srednjih vrijednosti "x" i "y", pronađite standardna odstupanja ovih varijabli. Standardna devijacija izračunava se prema sljedećoj formuli:
    • σx=1n1Σ(xμx)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • U našem primjeru izračuni će biti zapisani ovako:
    • σx=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σx=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σx=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σx=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σx=1,83{ displaystyle sigma _ {x} = 1,83}
  5. 5 Izračunajte standardnu ​​devijaciju "y". Slijedite korake navedene u prethodnom koraku. Koristite istu formulu, ali uključite vrijednosti y.
    • U našem primjeru izračuni će biti zapisani ovako:
    • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σy=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σy=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σy=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σy=2,58{ displaystyle sigma _ {y} = 2,58}
  6. 6 Zapišite osnovnu formulu za izračunavanje koeficijenta korelacije. Ova formula uključuje srednje vrijednosti, standardna odstupanja i broj (n) parova brojeva obje varijable. Koeficijent korelacije označava se kao "r" (u rijetkim slučajevima kao "ρ"). Ovaj članak koristi formulu za izračun Pearsonovog koeficijenta korelacije.
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = lijevo ({ frac {1} {n-1}} desno) Sigma lijevo ({ frac {x- mu _ {x}} { sigma _ {x}} } desno) * lijevo ({ frac {y- mu _ {y}} { sigma _ {y}}} desno)}
    • Ovdje i u drugim izvorima količine se mogu označiti na različite načine. Na primjer, neke formule sadrže "ρ" i "σ", dok druge sadrže "r" i "s". Neki udžbenici daju različite formule, ali su matematičke protuvrijednosti gornjoj formuli.
  7. 7 Izračunajte koeficijent korelacije. Izračunali ste srednju vrijednost i standardna odstupanja obje varijable, pa pomoću formule možete izračunati koeficijent korelacije. Podsjetimo da je "n" broj parova vrijednosti za obje varijable. Ostale vrijednosti izračunate su ranije.
    • U našem primjeru izračuni će biti zapisani ovako:
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = lijevo ({ frac {1} {n-1}} desno) Sigma lijevo ({ frac {x- mu _ {x}} { sigma _ {x}} } desno) * lijevo ({ frac {y- mu _ {y}} { sigma _ {y}}} desno)}
    • ρ=(13){ displaystyle rho = lijevo ({ frac {1} {3}} desno) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle lijevo ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1,83}} desno) * lijevo ({ frac {3-4} {2,58}} desno)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + lijevo ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ({ frac { 5-3} {1,83}} desno) * lijevo ({ frac {7-4} {2,58}} desno)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = lijevo ({ frac {1} {3}} desno) * lijevo ({ frac {6 + 1 + 1 + 6} {4.721}} desno)}
    • ρ=(13)2,965{ displaystyle rho = lijevo ({ frac {1} {3}} desno) * 2.965}
    • ρ=(2,9653){ displaystyle rho = lijevo ({ frac {2,965} {3}} desno)}
    • ρ=0,988{ displaystyle rho = 0,988}
  8. 8 Analizirajte rezultat. U našem primjeru koeficijent korelacije je 0,988. Ova vrijednost na neki način karakterizira zadani skup parova brojeva. Obratite pozornost na znak i veličinu vrijednosti.
    • Budući da je vrijednost koeficijenta korelacije pozitivna, postoji pozitivna korelacija između varijabli "x" i "y". Odnosno, kako se vrijednost "x" povećava, povećava se i vrijednost "y".
    • Budući da je vrijednost koeficijenta korelacije vrlo blizu +1, vrijednosti varijabli "x" i "y" jako su povezane. Ako točke postavite na koordinatnu ravninu, one će se nalaziti blizu neke ravne crte.

Metoda 2 od 4: Korištenje mrežnih kalkulatora za izračun koeficijenta korelacije

  1. 1 Pronađite kalkulator na internetu za izračun koeficijenta korelacije. Taj se koeficijent često izračunava u statistici. Ako postoji mnogo parova brojeva, gotovo je nemoguće ručno izračunati koeficijent korelacije. Stoga postoje mrežni kalkulatori za izračun koeficijenta korelacije. U tražilicu unesite "kalkulator koeficijenta korelacije" (bez navodnika).
  2. 2 Unesite podatke. Provjerite upute na web stranici da biste unijeli točne podatke (parove brojeva). Imperativ je unijeti odgovarajuće parove brojeva; u suprotnom ćete dobiti pogrešan rezultat. Upamtite da različite web stranice imaju različite formate unosa.
    • Na primjer, na http://ncalculators.com/statistics/correlation-coefficient-calculator.htm vrijednosti varijabli x i y unose se u dva vodoravna retka. Vrijednosti su odvojene zarezima. Odnosno, u našem primjeru vrijednosti "x" unose se ovako: 1,2,4,5, a vrijednosti "y" ovako: 1,3,5,7.
    • Na drugom mjestu, http://www.alcula.com/calculators/statistics/correlation-coefficient/, podaci se unose okomito; u ovom slučaju nemojte brkati odgovarajuće parove brojeva.
  3. 3 Izračunajte koeficijent korelacije. Nakon unosa podataka, jednostavno kliknite gumb "Izračunaj", "Izračunaj" ili slično kako biste dobili rezultat.

Metoda 3 od 4: Korištenje grafičkog kalkulatora

  1. 1 Unesite podatke. Uzmite grafički kalkulator, idite u način statističkog izračuna i odaberite naredbu "Uredi".
    • Različiti kalkulatori zahtijevaju pritisak različitih tipki. U ovom se članku govori o kalkulatoru Texas Instruments TI-86.
    • Pritisnite [2.] - Stat (iznad tipke +) za ulazak u način statističkog izračuna. Zatim pritisnite F2 - Uredi.
  2. 2 Izbrišite prethodne spremljene podatke. Većina kalkulatora čuva unesene statistike sve dok ih ne izbrišete. Kako ne biste zamijenili stare podatke s novim, prvo izbrišite sve pohranjene podatke.
    • Pomoću tipki sa strelicama pomičite pokazivač i označite naslov 'xStat'. Zatim pritisnite Clear i Enter za brisanje svih vrijednosti unetih u stupac xStat.
    • Pomoću tipki sa strelicama označite naslov 'yStat'. Zatim pritisnite Clear i Enter za brisanje svih vrijednosti unetih u stupac yStat.
  3. 3 Unesite početne podatke. Pomoću tipki sa strelicama pomaknite pokazivač na prvu ćeliju pod naslovom "xStat". Unesite prvu vrijednost i pritisnite Enter. Pri dnu zaslona prikazuje se "xStat (1) = __", pri čemu unesena vrijednost zamjenjuje razmak. Nakon što pritisnete Enter, unesena vrijednost pojavit će se u tablici, a pokazivač će se pomaknuti u sljedeći redak; ovo će prikazati "xStat (2) = __" pri dnu zaslona.
    • Unesite sve vrijednosti za varijablu "x".
    • Nakon unosa svih vrijednosti za x, pomoću tipki sa strelicama dođite do stupca yStat i unesite vrijednosti za y.
    • Nakon što unesete sve parove brojeva, pritisnite Izlaz da biste očistili zaslon i izašli iz načina združivanja.
  4. 4 Izračunajte koeficijent korelacije. Karakterizira koliko su podaci blizu određene ravne crte. Grafički kalkulator može brzo odrediti odgovarajuću ravnu liniju i izračunati koeficijent korelacije.
    • Pritisnite Stat - Izračunaj. Na TI -86 pritisnite [2.] - [Stat] - [F1].
    • Odaberite funkciju linearne regresije. Na TI-86 pritisnite [F3] s oznakom "LinR". Na ekranu će se prikazati linija "LinR _" s trepćućim kursorom.
    • Sada unesite nazive dviju varijabli: xStat i yStat.
      • Na TI-86 otvorite popis imena; da biste to učinili, pritisnite [2.] - [Popis] - [F3].
      • Dostupne varijable prikazane su u donjem retku zaslona. Odaberite [xStat] (vjerojatno ćete za to morati pritisnuti F1 ili F2), unesite zarez, a zatim odaberite [yStat].
      • Pritisnite Enter za obradu unesenih podataka.
  5. 5 Analizirajte svoje rezultate. Pritiskom na Enter na zaslonu će se prikazati sljedeće informacije:
    • y=a+bx{ displaystyle y = a + bx}: ovo je funkcija koja opisuje liniju. Imajte na umu da funkcija nije zapisana u standardnom obliku (y = kx + b).
    • a={ displaystyle a =}... Ovo je y-koordinata presjeka ravne crte s osi y.
    • b={ displaystyle b =}... Ovo je nagib linije.
    • ispr={ displaystyle { text {corr}} =}... Ovo je koeficijent korelacije.
    • n={ displaystyle n =}... Ovo je broj parova brojeva koji su korišteni u izračunima.

Metoda 4 od 4: Objašnjenje osnovnih pojmova

  1. 1 Shvatiti pojam korelacije. Korelacija je statistički odnos između dviju veličina. Koeficijent korelacije je numerička vrijednost koja se može izračunati za bilo koja dva skupa podataka. Vrijednost koeficijenta korelacije uvijek se nalazi u rasponu od -1 do +1 i karakterizira stupanj odnosa između dvije varijable.
    • Na primjer, s obzirom na visinu i dob djece (oko 12 godina). Najvjerojatnije će doći do snažne pozitivne korelacije jer djeca s godinama postaju sve viša.
    • Primjer negativne korelacije: kaznene sekunde i vrijeme provedeno na treningu biatlona, ​​odnosno što više sportaš trenira, dosudit će se manje kaznenih sekundi.
    • Konačno, ponekad postoji vrlo mala korelacija (pozitivna ili negativna), na primjer između veličine cipela i rezultata iz matematike.
  2. 2 Sjetite se kako izračunati aritmetičku sredinu. Da biste izračunali aritmetičku sredinu (ili srednju vrijednost), morate pronaći zbroj svih ovih vrijednosti, a zatim je podijeliti s brojem vrijednosti. Zapamtite da je aritmetička sredina potrebna za izračun koeficijenta korelacije.
    • Prosječna vrijednost varijable označena je slovom s vodoravnom trakom iznad nje. Na primjer, u slučaju varijabli "x" i "y", njihove srednje vrijednosti označene su kako slijedi: x̅ i y̅. Srednja vrijednost ponekad se označava grčkim slovom "μ" (mu). Za zapis aritmetičke sredine vrijednosti varijable "x" upotrijebite oznaku μx ili μ (x).
    • Na primjer, s obzirom na sljedeće vrijednosti za varijablu "x": 1,2,5,6,9,10. Aritmetička sredina ovih vrijednosti izračunava se na sljedeći način:
      • μx=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μx=33/6{ displaystyle mu _ {x} = 33/6}
      • μx=5,5{ displaystyle mu _ {x} = 5,5}
  3. 3 Obratite pozornost na važnost standardne devijacije. U statistikama, standardna devijacija karakterizira stupanj do kojeg su brojevi raspršeni u odnosu na njihovu srednju vrijednost. Ako je standardna devijacija mala, brojevi su blizu srednje vrijednosti; ako je standardna devijacija velika, brojke su daleko od srednje vrijednosti.
    • Standardno odstupanje označeno je slovom "s" ili grčkim slovom "σ" (sigma). Dakle, standardna devijacija vrijednosti varijable "x" označena je na sljedeći način: sx ili σx.
  4. 4 Zapamtite simbol operacije zbrajanja. Simbol zbrajanja jedan je od najčešćih simbola u matematici i označava zbroj vrijednosti. Ovaj simbol je grčko slovo "Σ" (veliko slovo sigma).
    • Na primjer, ako se daju sljedeće vrijednosti varijable "x": 1,2,5,6,9,10, tada Σx znači:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Savjeti

  • Koeficijent korelacije ponekad se naziva "Pearsonov koeficijent korelacije" prema svom programeru Carlu Pearsonu.
  • U većini slučajeva, kada je koeficijent korelacije veći od 0,8 (pozitivan ili negativan), postoji jaka korelacija; ako je koeficijent korelacije manji od 0,5 (pozitivan ili negativan), uočava se slaba korelacija.

Upozorenja

  • Korelacija karakterizira odnos između vrijednosti dviju varijabli. Ali zapamtite da korelacija nema nikakve veze s uzročno -posljedičnom povezanošću. Na primjer, ako usporedite visinu i veličinu cipela ljudi, vjerojatno ćete pronaći snažnu pozitivnu korelaciju. Općenito, što je osoba viša, veća je i veličina cipela. No to ne znači da povećanje visine dovodi do automatskog povećanja veličine cipela ili da će veća stopala dovesti do bržeg rasta. Ove su količine jednostavno međusobno povezane.