Dispersijos apskaičiavimo būdai

Autorius: Robert Simon
Kūrybos Data: 21 Birželio Birželio Mėn 2021
Atnaujinimo Data: 1 Liepos Mėn 2024
Anonim
Skaičiavimo metodikos ir apvalinimas
Video.: Skaičiavimo metodikos ir apvalinimas

Turinys

Dispersija matuoja duomenų rinkinio sklaidą. Tai labai naudinga kuriant statistinius modelius: mažas dispersija gali būti nuoroda, kad aprašote atsitiktinę klaidą ar triukšmą, o ne pagrindinį duomenų ryšį. Šiame straipsnyje „wikiHow“ išmokys apskaičiuoti dispersiją.

Žingsniai

1 metodas iš 2: apskaičiuokite mėginio dispersiją

  1. Parašykite pavyzdinį duomenų rinkinį. Daugeliu atvejų statistikai turi informacijos tik apie tiriamą gyventojų imtį arba pogrupį. Pavyzdžiui, užuot atlikęs bendrą „visų automobilių kainos Vokietijoje“ analizę, statistikas gali rasti kelių tūkstančių automobilių atsitiktinės imties kainą. Tas statistikas gali pasinaudoti šia imtimi norėdamas gerai apskaičiuoti automobilio kainą Vokietijoje. Tačiau labiau tikėtina, kad jis tiksliai neatitiks tikrųjų skaičių.
    • Pavyzdžiui: Analizuodami kavinėje per dieną parduodamų bandelių skaičių, paėmėte atsitiktinį šešių dienų mėginį ir gavote šiuos rezultatus: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. Tai yra pavyzdys, o ne populiacija, nes neturite duomenų apie kiekvieną dieną, kai parduotuvė dirba.
    • Jei kiekvienas Duomenų taškai pagrindiniame kompiuteryje, prašome pereiti prie toliau nurodyto metodo.

  2. Užrašykite dispersijos imties formulę. Duomenų rinkinio dispersija rodo duomenų taškų sklaidos laipsnį. Kuo arčiau dispersijos yra nulis, tuo arčiau grupuojami duomenų taškai. Dirbdami su duomenų rinkinių pavyzdžiais, naudokite šią formulę, kad apskaičiuotumėte dispersiją:
    • = /(n - 1)
    • yra dispersija. Dispersija visada skaičiuojama kvadratais.
    • reiškia jūsų duomenų rinkinio vertę.
    • ∑, reiškiantis „suma“, nurodo apskaičiuoti šiuos kiekvienos vertės parametrus ir tada juos susieti.
    • x̅ yra imties vidurkis.
    • n yra duomenų taškų skaičius.

  3. Apskaičiuokite mėginio vidurkį. Simbolis x̅ arba „x-horizontal“ naudojamas imties vidurkiui nurodyti. Apskaičiuokite taip, kaip apskaičiuotumėte bet kokį vidurkį: susumuokite visus duomenų taškus ir padalykite juos iš taškų skaičiaus.
    • Pavyzdžiui: Pirmiausia susumuokite savo duomenų taškus: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Tada padalykite rezultatą iš duomenų taškų skaičiaus, šiuo atveju šešių: 84 ÷ 6 = 14.
      Imties vidurkis = x̅ = 14.
    • Vidurkį galite laikyti duomenų „centriniu tašku“. Jei duomenys sutelkti aplink vidurkį, dispersija yra maža. Jei jie yra išsklaidyti toli nuo vidurkio, dispersija yra didelė.

  4. Iš kiekvieno duomenų taško atimkite vidurkį. Dabar atėjo laikas apskaičiuoti - x̅, kur yra kiekvienas jūsų duomenų rinkinio taškas. Kiekvienas rezultatas parodys nukrypimą nuo kiekvieno atitinkamo taško vidurkio arba, paprasčiau tariant, atstumą nuo jo iki vidurkio.
    • Pavyzdžiui:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • Labai lengva patikrinti savo skaičiavimus, nes rezultatai turi būti lygūs nuliui. Taip yra todėl, kad vidurkio vidurkis yra neigiamas (atstumas nuo vidurkio iki mažų skaičių). teigiami rezultatai (atstumas nuo vidurkio iki didesnio skaičiaus) visiškai pašalinami.
  5. Kvadratizuokite visus rezultatus. Kaip pažymėta aukščiau, dabartinio nuokrypių sąrašo (- x̅) suma yra lygi nuliui. Tai reiškia, kad „vidutinis nuokrypis“ taip pat visada bus nulis ir nieko negalima pasakyti apie duomenų sklaidą. Norėdami išspręsti šią problemą, randame kiekvieno nuokrypio kvadratą. Dėl to visi yra teigiami skaičiai, neigiamos ir teigiamos vertės nebeatšaukia viena kitos ir suteikia sumai nulį.
    • Pavyzdžiui:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Dabar kiekvienam duomenų pavyzdžiui turite (- x̅).
  6. Raskite kvadratų reikšmių sumą. Dabar laikas apskaičiuoti visą formulės skaitiklį: ∑. Didelis ciklas ∑ reikalauja, kad kiekvienai reikšmei pridėtumėte šią elemento vertę. Apskaičiavote (- x̅) kiekvienai imties vertei, todėl jums tereikia tiesiog susumuoti rezultatus.
    • Pavyzdžiui: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Padalinkite iš n - 1, kur n yra duomenų taškų skaičius. Seniai, skaičiuodami imties dispersiją, statistikai padalijo tik iš n. Šis padalijimas suteiks kvadrato nuokrypio vidurkį, kuris tiksliai atitinka tos imties dispersiją. Tačiau nepamirškite, kad imtis yra tik didesnės populiacijos įvertinimas. Jei paimsite kitą atsitiktinę imtį ir atliksite tą patį skaičiavimą, gausite kitokį rezultatą. Kaip paaiškėja, padalijus iš n -1 vietoj n, galima geriau įvertinti didesnės populiacijos dispersiją - kuri jums tikrai rūpi. Ši korekcija yra tokia įprasta, kad dabar ji yra priimta imties dispersijos apibrėžtis.
    • Pavyzdžiui: Imtyje yra šeši duomenų taškai, taigi n = 6.
      Imties dispersija = 33,2
  8. Suprasti dispersiją ir standartinį nuokrypį. Atkreipkite dėmesį, kad kadangi formulėje yra galių, dispersija matuojama pradinių duomenų vienetų kvadrate. Tai vizualiai glumina. Užtat dažnai standartinis nuokrypis yra gana naudingas. Bet nėra prasmės gaišti jokių pastangų, nes standartinį nuokrypį lemia kvadratinė dispersijos šaknis. Štai kodėl imties dispersija rašoma kaip, o standartinis imties nuokrypis yra.
    • Pavyzdžiui, minėto pavyzdžio standartinis nuokrypis = s = √33,2 = 5,76.
    skelbimas

2 metodas iš 2: Apskaičiuokite populiacijos dispersiją

  1. Pradedant nuo pagrindinių duomenų rinkinio. Terminas „populiacija“ vartojamas nurodyti visiems susijusiems pastebėjimams. Pavyzdžiui, jei tiriate Hanojaus gyventojų amžių, į jūsų bendrą gyventojų skaičių įeis visų Hanojuje gyvenančių asmenų amžius. Paprastai jūs sukūrėte tokio didelio duomenų rinkinio skaičiuoklę, bet čia yra mažesnis duomenų rinkinio pavyzdys:
    • Pavyzdžiui: Akvariumo kambaryje yra lygiai šeši akvariumai. Šiuose šešiuose rezervuaruose yra toks žuvų skaičius:





  2. Parašykite bendros dispersijos formulę. Kadangi populiacijoje yra visi mums reikalingi duomenys, ši formulė pateikia tikslią populiacijos dispersiją. Norėdami atskirti jį nuo imties dispersijos (kuri yra tik apytikslė sąmata), statistikai naudoja kitus kintamuosius:
    • σ = /n
    • σ = imties dispersija. Tai paprastai kvadrato formos dešra. Dispersija matuojama kvadratiniais vienetais.
    • reiškia elementą jūsų duomenų rinkinyje.
    • Elementas ∑ apskaičiuojamas kiekvienai vertei ir tada susumuojamas.
    • μ yra bendras vidurkis.
    • n yra duomenų taškų skaičius populiacijoje.
  3. Raskite populiacijos vidurkį. Analizuojant populiaciją, simbolis μ („mu“) reiškia aritmetinį vidurkį. Norėdami rasti vidurkį, susumuokite visus duomenų taškus, tada padalykite iš taškų skaičiaus.
    • Galima galvoti apie „vidutinį“, bet būkite atsargūs, nes šis žodis turi daug matematinių apibrėžimų.
    • Pavyzdžiui: vidutinė vertė = μ = = 10,5
  4. Iš kiekvieno duomenų taško atimkite vidurkį. Arčiau vidurkio esančių duomenų taškų skirtumas yra artimesnis nuliui. Pakartokite visų duomenų taškų atimties problemą ir tikriausiai pradėsite jausti duomenų išsisklaidymą.
    • Pavyzdžiui:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Kiekvieną ženklą išklokite kvadratu. Šiuo metu kai kurie ankstesnio žingsnio rezultatai bus neigiami, o kiti - teigiami.Jei vizualizuojate duomenis izomorfinėje eilutėje, šie du elementai žymi vidurkio kairėje ir dešinėje esančius skaičius. Tai nebūtų naudinga apskaičiuojant dispersiją, nes šios dvi grupės panaikins viena kitą. Vietoj to, sutvirtinkite juos visus, kad visi būtų teigiami.
    • Pavyzdžiui:
      (- μ) kiekvienai reikšmei i trunka nuo 1 iki 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Raskite savo rezultatų vidurkį. Dabar turite kiekvieno duomenų taško vertę, susietą (ne tiesiogiai) su tuo, kiek toli nuo duomenų taško yra vidurkis. Vidutinis, sudėjus juos ir padalijus iš turimų verčių skaičiaus.
    • Pavyzdžiui:
      Bendrasis dispersija = 24,25
  7. Kontaktinis receptas. Jei nesate tikri, kaip tai atitinka metodo pradžioje pateiktą formulę, ranka užrašykite visą problemą ir netrumpinkite:
    • Radę skirtumą nuo vidurkio ir kvadrato, gausite (- μ), (- μ) ir taip toliau (- μ), kur yra paskutinis duomenų taškas. duomenų rinkinyje.
    • Norėdami rasti šių verčių vidurkį, sudėkite juos ir padalykite iš n: ((- μ) + (- μ) + ... + (- μ)) / n
    • Perrašę skaitiklį sigmoidine notacija, turite /n, formulės dispersija.
    skelbimas

Patarimas

  • Kadangi dispersiją sunku interpretuoti, ši vertė dažnai apskaičiuojama kaip atspirties taškas norint rasti standartinį nuokrypį.
  • Naudojant vardiklyje „n-1“ vietoj „n“ yra Besselio korekcija. Imtis yra tik visos populiacijos įvertis, o imties vidurkis turi tam tikrą šališkumą, kad atitiktų tą įvertį. Ši korekcija pašalina minėtą šališkumą. Tai susiję su tuo, kad surašius n - 1 duomenų tašką, paskutinis trečiasis punktas n buvo konstanta, nes tik tam tikros reikšmės buvo naudojamos apskaičiuojant imties vidurkį (x̅) dispersijos formulėje.