Kako izračunati emisije

Autor: Janice Evans
Datum Stvaranja: 23 Srpanj 2021
Datum Ažuriranja: 1 Srpanj 2024
Anonim
Kako izracunati nutritivni unos | Proteina - Masti i Ugljikohidrata | Procjena vaseg Body Fat-a
Video: Kako izracunati nutritivni unos | Proteina - Masti i Ugljikohidrata | Procjena vaseg Body Fat-a

Sadržaj

U statistici, isticanja su vrijednosti koje se oštro razlikuju od drugih vrijednosti u prikupljenom skupu podataka. Odstupanje može ukazivati ​​na anomalije u distribuciji podataka ili pogreške pri mjerenju, pa se odstupanja često isključuju iz skupa podataka. Uklanjanjem ispadanja iz skupa podataka možete doći do neočekivanih ili točnijih zaključaka. Stoga je potrebno znati izračunati i procijeniti izvanredne vrijednosti kako bi se osiguralo pravilno razumijevanje statistike.

Koraci

  1. 1 Naučite prepoznati potencijalne odstupanja. Prije isključivanja izlaza iz skupa podataka potrebno je identificirati potencijalne odstupanja. Odstupanja su vrijednosti koje se jako razlikuju od većine vrijednosti u skupu podataka; drugim riječima, odstupanja su izvan trenda većine vrijednosti. To je lako pronaći u tablicama vrijednosti ili (osobito) u grafikonima. Ako su vrijednosti u skupu podataka iscrtane, odstupanja će ležati daleko od većine drugih vrijednosti. Ako, na primjer, većina vrijednosti pada na ravnu liniju, tada ispadi leže s obje strane takve ravne crte.
    • Na primjer, razmotrite skup podataka koji predstavlja temperature 12 različitih objekata u prostoriji. Ako je 11 objekata približno 70 stupnjeva, ali je dvanaesti predmet (moguće peć) 300 stupnjeva, tada brz pogled na vrijednosti može ukazati da je peć vjerojatno ispuhavanje.
  2. 2 Sortirajte podatke uzlaznim redoslijedom. Prvi korak u određivanju odstupanja je izračun medijane skupa podataka. Ovaj je zadatak uvelike pojednostavljen ako su vrijednosti u skupu podataka poredane uzlaznim redoslijedom (od najmanjeg do najvećeg).
    • Nastavljajući s gornjim primjerom, razmotrite sljedeći skup podataka koji predstavlja temperature više objekata: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Ovaj skup treba naručiti na sljedeći način: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Izračunajte medijanu skupa podataka. Medijan skupa podataka je vrijednost u sredini skupa podataka. Ako skup podataka sadrži neparan broj vrijednosti, medijana je vrijednost prije i nakon koje postoji isti broj vrijednosti u skupu podataka. No ako skup podataka sadrži paran broj vrijednosti, tada morate pronaći aritmetičku sredinu dviju sredina. Imajte na umu da se pri izračunavanju izvanrednih vrijednosti medijana obično naziva Q2 jer se nalazi između Q1 i Q3, donjeg i gornjeg kvartila, što ćemo kasnije definirati.
    • Nemojte se bojati raditi sa skupovima podataka koji imaju paran broj vrijednosti- aritmetička sredina dvaju sredina bit će broj koji nije u skupu podataka; ovo je normalno. Ali ako su dvije srednje vrijednosti isti broj, tada je aritmetička sredina jednaka ovom broju; ovo je također u poretku stvari.
    • U gornjem primjeru, srednje 2 vrijednosti su 70 i 71, pa je medijana ((70 + 71) / 2) = 70,5.
  4. 4 Izračunajte donji kvartil. Ova vrijednost, koja se naziva Q1, je ispod koje leži 25% vrijednosti skupa podataka. Drugim riječima, to je polovica vrijednosti do medijane. Ako postoji parni broj vrijednosti iz skupa podataka prije medijane, morate pronaći aritmetičku sredinu dvaju sredina kako biste izračunali Q1 (to je slično izračunavanju medijane).
    • U našem primjeru, 6 vrijednosti nalazi se nakon medijane, a 6 vrijednosti- prije nje. To znači da za izračun donjeg kvartila moramo pronaći aritmetičku sredinu dviju sredina od šest vrijednosti koje leže prije medijane. Ovdje su prosječne vrijednosti 70 i 70. Dakle, Q1 = ((70 + 70) / 2) = 70.
  5. 5 Izračunajte gornji kvartil. Ova vrijednost, koja se naziva Q3, je iznad koje leži 25% vrijednosti skupa podataka. Postupak izračunavanja Q3 sličan je postupku izračunavanja Q1, ali ovdje se uzimaju u obzir vrijednosti nakon medijane.
    • U gornjem primjeru dva prosjeka šestice nakon medijane su 71 i 72. Dakle, Q3 = ((71 + 72) / 2) = 71,5.
  6. 6 Izračunajte interkvartilni raspon. Izračunavši Q1 i Q3, potrebno je pronaći udaljenost između ovih vrijednosti. Da biste to učinili, oduzmite Q1 od Q3. Vrijednost interkvartilnog raspona iznimno je važna za određivanje granica vrijednosti koje nisu odstupanja.
    • U našem primjeru, Q1 = 70 i Q3 = 71,5. Interkvartilni raspon je 71,5 - 70 = 1,5.
    • Imajte na umu da se to odnosi i na negativne vrijednosti Q1 i Q3. Na primjer, ako je Q1 = -70, tada je međukvartilni raspon 71,5 -(-70) = 141,5.
  7. 7 Pronađite "unutarnje granice" vrijednosti u skupu podataka. Odstupanja se određuju analizom vrijednosti- bilo da spadaju u takozvane "unutarnje granice" i "vanjske granice" ili ne. Vrijednost izvan "unutarnjih granica" klasificira se kao "manji odstupanje", dok se vrijednost izvan "vanjskih granica" klasificira kao "značajan izvanbroj". Da biste pronašli unutarnje granice, morate pomnožiti međukvartilni raspon s 1,5; rezultat se mora dodati u Q3 i oduzeti od Q1. Dva pronađena broja unutarnje su granice skupa podataka.
    • U našem primjeru interkvartilni raspon je (71,5 - 70) = 1,5. Dalje: 1,5 * 1,5 = 2,25. Ovaj se broj mora dodati Q3 i oduzeti od Q1 kako bi se pronašle unutarnje granice:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Dakle, unutarnje granice su 67,75 i 73,75.
    • U našem primjeru samo temperatura peći - 300 stupnjeva - nalazi se izvan ovih granica i može se smatrati beznačajnom emisijom. No, nemojte žuriti sa zaključcima - moramo utvrditi je li ova temperatura značajan odstupanje.
  8. 8 Pronađite "vanjske granice" skupa podataka. To se radi na isti način kao i za unutarnje granice, samo što se međukvartilni raspon množi s 3 umjesto s 1,5. Rezultat se mora dodati u Q3 i oduzeti od Q1. Dva pronađena broja vanjske su granice skupa podataka.
    • U našem primjeru pomnožite interkvartilni raspon s 3: 1,5 * 3 = 4,5. Izračunajte vanjske granice:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Dakle, vanjske granice su 65,5 i 76.
    • Sve vrijednosti koje prelaze vanjske granice smatraju se značajnim emisijama. U našem primjeru, temperatura peći od 300 stupnjeva smatra se značajnim ispuhavanjem.
  9. 9 Upotrijebite kvalitativnu procjenu kako biste utvrdili trebaju li se vanjski podaci isključiti iz skupa podataka. Gore opisana metoda omogućuje vam da utvrdite jesu li neke vrijednosti izvanredne (manje ili značajne). Ipak, nemojte pogriješiti - vrijednost koja je klasificirana kao izvanredna samo je "kandidat" za iznimku, što znači da je ne morate isključiti. Uzrok isticanja glavni je čimbenik koji utječe na odluku o isključivanju isticanja. U pravilu su isključeni ispadi koji nastaju zbog pogrešaka (u mjerenjima, snimkama itd.). S druge strane, izdvojenosti povezane ne s pogreškama, već s novim informacijama ili trendom obično se ostavljaju u skupu podataka.
    • Jednako je važno procijeniti učinak izvanrednih vrijednosti na medijanu skupa podataka (izvijaju li ga ili ne). To je osobito važno kada donosite zaključke iz medijane skupa podataka.
    • U našem primjeru iznimno je malo vjerojatno da će se pećnica zagrijati na temperaturu od 300 stupnjeva (osim ako ne uzmemo u obzir prirodne anomalije). Stoga se može zaključiti (s visokim stupnjem sigurnosti) da je takva temperatura pogreška u mjerenju koju je potrebno isključiti iz skupa podataka. Štoviše, ako ne isključite ispadanje, medijana skupa podataka bit će (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 stupnjeva, ali ako isključite ispadanje, medijana će biti (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 stupnjeva.
      • Odstupanja su obično posljedica ljudske pogreške, pa ih je potrebno isključiti iz skupova podataka.
  10. 10 Shvatite važnost (ponekad) izdvojenih ostataka u skupu podataka. Neke odstupanja treba isključiti iz skupa podataka jer su to zbog pogrešaka i tehničkih problema; ostale izdvojene vrijednosti treba ostaviti u skupu podataka. Ako, na primjer, izdvojenost nije rezultat pogreške i / ili pruža novo razumijevanje fenomena koji se testira, tada ga treba ostaviti u skupu podataka. Znanstveni eksperimenti posebno su osjetljivi na isticanje - pogrešnim uklanjanjem izdvajanja možda ćete propustiti neki novi trend ili otkriće.
    • Na primjer, razvijamo novi lijek za povećanje veličine ribe u ribarstvu. Koristit ćemo stari skup podataka ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), ali ovaj put svaka vrijednost predstavlja težinu ribe (u gramima) nakon gutanja eksperimentalni lijek. Drugim riječima, prvi lijek dovodi do povećanja težine ribe do 71 g, drugi lijek - do 70 g, i tako dalje. U ovoj situaciji 300 je značajan izuzetak, ali ga ne smijemo isključiti; ako pretpostavimo da nije bilo pogrešaka u mjerenju, onda je takav outlier značajan uspjeh u eksperimentu. Lijek, koji je povećao težinu ribe na 300 grama, djeluje puno bolje od ostalih lijekova; stoga je 300 najvažnija vrijednost u skupu podataka.

Savjeti

  • Kad se pronađu odstupanja, pokušajte objasniti njihovu prisutnost prije nego ih isključite iz skupa podataka. Mogu ukazivati ​​na pogreške mjerenja ili anomalije distribucije.

Što trebaš

  • Kalkulator