Odrediti koeficijent korelacije

Autor: Morris Wright
Datum Stvaranja: 28 Travanj 2021
Datum Ažuriranja: 19 Lipanj 2024
Anonim
Correlation Coefficient
Video: Correlation Coefficient

Sadržaj

Koeficijent korelacije, označen s r ili ρ, mjera je linearne korelacije (odnosa u snazi ​​i smjeru) između dvije varijable. Kreće se od -1 do +1, koristeći znakove plus i minus za predstavljanje pozitivne i negativne korelacije. Ako je koeficijent korelacije točno -1, tada je odnos između dvije varijable potpuno negativan; ako je koeficijent korelacije točno +1, tada je odnos potpuno pozitivan. Dvije varijable mogu imati pozitivnu, negativnu ili nikakvu korelaciju. Korelaciju možete izračunati ručno, koristeći neke besplatne izračune korelacije dostupne na mreži ili pomoću statističkih funkcija dobrog grafičkog kalkulatora.

Kročiti

Metoda 1 od 4: Izračunajte koeficijent korelacije ručno

  1. Prvo prikupite svoje podatke. Da biste započeli s izračunavanjem učinkovite korelacije, prvo ispitajte parove podataka. Korisno ih je staviti u tablicu, i okomito i vodoravno. Označite svaki redak ili stupac x i y.
    • Na primjer, pretpostavimo da imate četiri para podataka za x i g. Tablica tada može izgledati ovako:
      • x || g
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Izračunajte srednju vrijednost x. Da biste izračunali srednju vrijednost, trebate sve vrijednosti od x zbroji i podijeli s brojem vrijednosti.
    • Koristeći gornji primjer, primijetite da imate četiri vrijednosti za x. Da biste izračunali srednju vrijednost, zbrajate sve vrijednosti x i podijelite s 4. Izračun izgleda ovako:
    • μx=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Pronađite srednju vrijednost g. U prosjeku od g Da biste ga pronašli, slijedite iste korake, zbrajajući sve vrijednosti y, a zatim dijeleći s brojem vrijednosti.
      • U gornjem primjeru također imate četiri vrijednosti za g. Sve ove vrijednosti zbrojite, a zatim podijelite s 4. Izračuni će izgledati ovako:
      • μg=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Odrediti standardno odstupanje od x. Kad steknete svoja sredstva, možete izračunati standardno odstupanje. Da biste to učinili, upotrijebite formulu:
        • σx=1n1Σ(xμx)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Izračunajte standardno odstupanje od g. Koristeći iste osnovne korake, pronađite standardno odstupanje od g. Koristit ćete istu formulu, koristeći podatkovne točke za y.
          • S uzorcima podataka, vaši izračuni će izgledati ovako:
          • σg=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Pregledajte osnovnu formulu za određivanje koeficijenta korelacije. Formula za izračunavanje koeficijenta korelacije koristi sredstva, standardna odstupanja i broj parova u skupu podataka (predstavljen s n). Sam koeficijent korelacije predstavljen je malim slovom r ili grčkim slovom ρ (rho). Za ovaj ćemo članak koristiti formulu poznatu kao Pearsonov koeficijent korelacije kako je prikazano u nastavku:
            • ρ=(1n1)Σ(xμxσx)(gμgσg){ displaystyle rho = lijevo ({ frac {1} {n-1}} desno) Sigma lijevo ({ frac {x- mu _ {x}} { sigma _ {x}} } desno) * lijevo ({ frac {y- mu _ {y}} { sigma _ {y}}} desno)}Odrediti koeficijent korelacije. Sada imate sredstva i standardna odstupanja za svoje varijable, tako da možete prijeći na formulu koeficijenta korelacije. Zapamti to n predstavlja broj vrijednosti koje imate. Ostale relevantne informacije već ste razradili u gornjim koracima.
              • Koristeći uzorke podataka, podatke biste mogli unijeti u formulu koeficijenta korelacije i izračunati na sljedeći način:
              • ρ=(1n1)Σ(xμxσx)(gμgσg){ displaystyle rho = lijevo ({ frac {1} {n-1}} desno) Sigma lijevo ({ frac {x- mu _ {x}} { sigma _ {x}} } desno) * lijevo ({ frac {y- mu _ {y}} { sigma _ {y}}} desno)}Protumačite rezultat. Za ovaj skup podataka koeficijent korelacije je 0,988. Ovaj vam broj govori dvije stvari o podacima. Pogledajte znak broja i veličinu broja.
                • Budući da je koeficijent korelacije pozitivan, možete reći da postoji pozitivna korelacija između x podataka i y podataka. To znači da ako se povećaju vrijednosti x, očekujete i porast vrijednosti y.
                • Budući da je koeficijent korelacije vrlo blizu +1, x podaci i y podaci su vrlo usko povezani. Ako biste grafički prikazali ove točke, vidjeli biste da su vrlo dobra aproksimacija ravne crte.

Metoda 2 od 4: Korištenje internetskih kalkulatora korelacije

  1. Pretražite kalkulatore korelacije na mreži. Mjerenje korelacije prilično je standardni izračun za statističare. Izračun može postati vrlo dosadan za velike skupove podataka ako se radi ručno. Stoga su mnogi izvori zajedničke izračune korelacije učinili dostupnima na mreži. Upotrijebite bilo koju tražilicu i unesite pojam za pretraživanje "kalkulator korelacije".
  2. Unesite podatke. Pažljivo pročitajte upute na web mjestu kako biste mogli ispravno unijeti podatke. Važno je da se parovi podataka drže u redu ili ćete dobiti netočan rezultat korelacije. Različite web stranice koriste različite formate za unos podataka.
    • Na primjer, na web mjestu http://ncalculators.com/statistics/correlation-coefficient-calculator.htm pronaći ćete vodoravni okvir za unos x vrijednosti i drugi vodoravni okvir za unos y vrijednosti. Pojmove unosite odvojeni samo zarezima. Dakle, x skup podataka izračunat ranije u ovom članku treba unijeti kao 1,2,4,5. Y skup podataka unosi se kao 1,3,5,7.
    • Na drugoj web lokaciji, http://www.alcula.com/calculators/statistics/correlation-coefficient/, možete unositi podatke vodoravno ili okomito, sve dok podatke držite u redu.
  3. Izračunajte rezultate. Ova su mjesta za izračun popularna jer nakon unosa podataka obično trebate samo pritisnuti gumb "Izračunaj" - rezultat će se automatski pojaviti.

Metoda 3 od 4: Korištenje grafičkog kalkulatora

  1. Unesite svoje podatke. Na grafičkom kalkulatoru omogućite funkciju statistike, a zatim odaberite naredbu "Uredi".
    • Svaki kalkulator ima malo drugačije naredbe tipki. Ovaj članak daje posebne upute za Texas Instruments TI-86.
    • Da biste pristupili funkciji Stat, pritisnite [2nd] -Stat (iznad tipke "+"), a zatim pritisnite F2-Edit.
  2. Izbrišite sve stare pohranjene podatke. Većina kalkulatora čuvat će statističke podatke dok se ne izbrišu. Da biste bili sigurni da ne brkate stare podatke s novim podacima, prvo trebate izbrisati sve prethodno spremljene podatke.
    • Pomoću tipki sa strelicama pomaknite kursor da biste označili kategoriju "xStat". Zatim pritisnite "Clear" i "Enter. Ovo bi trebalo izbrisati sve vrijednosti u stupcu xStat.
    • Pomoću tipki sa strelicama označite kategoriju "yStat". Pritisnite "Clear" i "Enter" da biste također obrisali podatke za taj stupac.
  3. Unesite vrijednosti podataka. Pomoću tipki sa strelicama pomaknite kursor na prvi prostor ispod zaglavlja xStat. Upišite svoju prvu vrijednost podataka, a zatim pritisnite Enter. Trebali biste vidjeti prostor na dnu zaslona "xStat (1) = __", gdje vaša vrijednost popunjava prazan prostor. Kad pritisnete Enter, podaci će popuniti tablicu, kursor će se pomaknuti na sljedeći redak, a redak na dnu zaslona trebao bi sada glasiti "xStat (2) = __".
    • Nastavite s unosom svih x vrijednosti.
    • Kada ste unijeli x vrijednosti, pomoću tipki sa strelicama prijeđite na yStat stupac i unesite y vrijednosti.
    • Kad su uneseni svi podaci, pritisnite Izlaz da biste očistili zaslon i izašli iz izbornika Stat.
  4. Izračunajte statistiku linearne regresije. Koeficijent korelacije mjera je koliko se podaci približavaju ravnoj crti. Grafički kalkulator sa statističkim funkcijama može vrlo brzo izračunati najprikladniju liniju i koeficijent korelacije.
    • Uđite u funkciju Stat, a zatim pritisnite gumb Calc. Na TI-86 ovo je [2.] [Stat] [F1].
    • Odaberite Linearni regresijski izračun. Na TI-86, ovo je [F3], s oznakom "LinR". Grafički zaslon tada će prikazati redak "LinR _" trepćućim pokazivačem.
    • Sada morate unijeti imena dviju varijabli koje želite izračunati. To su xStat i yStat.
      • Na TI-86 odaberite popis imena ("Imena") pritiskom na [2nd] [List] [F3].
      • Donji redak vašeg zaslona sada bi trebao prikazivati ​​dostupne varijable. Odaberite [xStat] (ovo je vjerojatno gumb F1 ili F2), zatim unesite zarez, a zatim [yStat].
      • Pritisnite Enter za izračun podataka
  5. Protumačite rezultate. Kad pritisnete Enter, kalkulator će odmah izračunati sljedeće podatke za podatke koje ste unijeli:
    • g=a+bx{ displaystyle y = a + bx}Razumjeti pojam korelacije. Korelacija se odnosi na statistički odnos dviju veličina. Koeficijent korelacije jedan je broj koji možete izračunati za dva skupa točaka podataka. Broj je uvijek nešto između -1 i +1 i pokazuje koliko su bliska dva skupa podataka.
      • Primjerice, ako ste izmjerili visinu i dob djece do otprilike 12 godina, očekivali biste snažnu pozitivnu korelaciju. Kako djeca postaju starija, ona postaju viša.
      • Primjer negativne korelacije je usporedba vremena koje neko provodi baveći se golfom s golf rezultatom te osobe. Kako praksa odmiče, rezultat bi trebao padati.
      • U konačnici biste očekivali malu korelaciju, pozitivnu ili negativnu, između veličine cipele, na primjer, i ocjene ispita.
    • Izračunajte srednju vrijednost. Aritmetička sredina ili "srednja vrijednost" skupa podataka izračunava se dodavanjem svih vrijednosti podataka, a zatim dijeljenjem s brojem vrijednosti u skupu. Da biste odredili koeficijent korelacije za svoje podatke, morate izračunati prosjek svakog skupa podataka.
      • Srednju vrijednost varijable označava varijabla s vodoravnom crtom iznad nje. To se često naziva "x-bar" ili "y-bar" za skupove podataka x i y. Alternativno, srednja vrijednost može se označiti malim grčkim slovom μ (mu). Na primjer, da biste naznačili sredinu podatkovnih točaka x, mogli biste koristiti μx ili μ (x).
      • Na primjer, ako imate skup x (1,2,5,6,9,10), prosjek ovih podataka izračunava se na sljedeći način:
        • μx=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Znati važnost standardne devijacije. U statistikama, standardno odstupanje mjeri varijaciju, pokazujući disperziju brojeva od srednje vrijednosti. Skupina brojeva s niskom standardnom devijacijom prilično je blizu jedna drugoj. Skupina brojeva s visokom standardnom devijacijom više je raspršena.
          • Kao simbol, standardna devijacija izražava se malim slovom s ili grčkim slovom σ (sigma). Dakle, standardno odstupanje x podataka zapisuje se kao sx ili σx.
        • Prepoznajte oznaku zbrajanja. Operator zbrajanja jedan je od najčešćih operatora u matematici i označava zbroj vrijednosti. Predstavlja se grčkim velikim slovom, sigmom ili ∑.
          • Na primjer, ako imate zbirku podatkovnih točaka x (1,2,5,6,9,10), tada ∑x znači:
            • 1+2+5+6+9+10 = 33

Savjeti

  • Koeficijent korelacije ponekad se naziva i "Pearsonovim koeficijentom korelacije proizvoda i trenutka" u čast Karla Pearsona, njegovog programera.
  • Općenito, koeficijent korelacije veći od 0,8 (pozitivan ili negativan) predstavlja snažnu korelaciju; koeficijent korelacije niži od 0,5 (ponovno pozitivan ili negativan) predstavlja slab koeficijent korelacije.

Upozorenja

  • Korelacija pokazuje da su dva skupa podataka na neki način povezana. Međutim, pripazite da ovo ne protumačite kao uzročno-posljedičnu vezu. Na primjer, ako usporedite veličine cipela i njihovu visinu, vjerojatno ćete pronaći snažnu pozitivnu korelaciju. Veći ljudi uglavnom imaju veća stopala. Međutim, to ne znači da će vam visoka stopa rasti ili da će vam velika stopala narasti. Jednostavno se događaju zajedno.