Kaip apskaičiuoti išmetamųjų teršalų kiekį

Autorius: Janice Evans
Kūrybos Data: 23 Liepos Mėn 2021
Atnaujinimo Data: 1 Liepos Mėn 2024
Anonim
Energetikos sąjunga. Netaršaus transporto propagavimas kovojant su klimato kaita (LT)
Video.: Energetikos sąjunga. Netaršaus transporto propagavimas kovojant su klimato kaita (LT)

Turinys

Statistikoje nukrypimai yra reikšmės, kurios smarkiai skiriasi nuo kitų surinkto duomenų rinkinio verčių. Nuokrypis gali nurodyti duomenų paskirstymo ar matavimo klaidų anomalijas, todėl nukrypimai dažnai neįtraukiami į duomenų rinkinį. Pašalinus iš duomenų rinkinio nukrypimus, galite padaryti netikėtas ar tikslesnes išvadas. Todėl, norint užtikrinti tinkamą statistikos supratimą, būtina mokėti apskaičiuoti ir įvertinti nuokrypius.

Žingsniai

  1. 1 Išmokite atpažinti galimus nukrypimus. Prieš neįtraukiant pašalinių iš duomenų rinkinio, reikia nustatyti galimus nukrypimus. Nuokrypiai yra vertės, kurios labai skiriasi nuo daugumos duomenų rinkinio verčių; kitaip tariant, daugumos vertybių tendencijos neatitinka nukrypimų. Tai lengva rasti verčių lentelėse arba (ypač) grafikuose. Jei duomenų rinkinio vertės yra nubraižytos, nukrypimai yra toli nuo daugumos kitų verčių. Jei, pavyzdžiui, dauguma reikšmių patenka tiesia linija, tada nukrypimai yra abiejose tokios tiesės pusėse.
    • Pavyzdžiui, apsvarstykite duomenų rinkinį, atspindintį 12 skirtingų kambario objektų temperatūrą. Jei 11 objektų yra maždaug 70 laipsnių, bet dvyliktas objektas (galbūt krosnis) yra 300 laipsnių, greitai pažvelgus į vertes, galima pastebėti, kad krosnis yra tikėtina.
  2. 2 Rūšiuokite duomenis didėjančia tvarka. Pirmasis žingsnis nustatant nuokrypius yra apskaičiuoti duomenų rinkinio mediana. Ši užduotis yra labai supaprastinta, jei duomenų rinkinio vertės yra išdėstytos didėjančia tvarka (nuo mažiausios iki didžiausios).
    • Tęsdami pirmiau pateiktą pavyzdį, apsvarstykite šį duomenų rinkinį, atspindintį kelių objektų temperatūrą: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Šį rinkinį reikia užsisakyti taip: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Apskaičiuokite duomenų rinkinio mediana. Duomenų rinkinio mediana yra reikšmė duomenų rinkinio viduryje. Jei duomenų rinkinyje yra nelyginis reikšmių skaičius, mediana yra reikšmė prieš ir po to, kai duomenų rinkinyje yra tas pats reikšmių skaičius. Bet jei duomenų rinkinyje yra lyginis reikšmių skaičius, turite rasti dviejų vidurkių aritmetinį vidurkį. Atkreipkite dėmesį, kad apskaičiuojant nuokrypius, mediana paprastai vadinama Q2, nes ji yra tarp Q1 ir Q3, apatinių ir viršutinių kvartilių, kuriuos apibrėžsime vėliau.
    • Nebijokite dirbti su duomenų rinkiniais, turinčiais lyginį skaičių reikšmių- dviejų vidurkių aritmetinis vidurkis bus skaičius, kurio nėra duomenų rinkinyje; Tai normalu. Bet jei dvi vidutinės vertės yra tas pats skaičius, tada aritmetinis vidurkis yra lygus šiam skaičiui; tai taip pat yra dalykų tvarka.
    • Anksčiau pateiktame pavyzdyje 2 vidurkio reikšmės yra 70 ir 71, taigi mediana yra ((70 + 71) / 2) = 70,5.
  4. 4 Apskaičiuokite apatinį kvartilį. Ši vertė, vadinama Q1, yra mažesnė nei 25% duomenų rinkinio verčių. Kitaip tariant, tai yra pusė verčių iki medianos. Jei prieš medianą duomenų rinkinyje yra lygus skaičius reikšmių, norint apskaičiuoti Q1, reikia rasti dviejų vidurkių aritmetinį vidurkį (tai panašu į medianos apskaičiavimą).
    • Mūsų pavyzdyje 6 vertės yra po vidurio ir 6 vertės- prieš ją. Tai reiškia, kad norėdami apskaičiuoti apatinį kvartilį, turime rasti dviejų vidurkių aritmetinį vidurkį iš šešių reikšmių, esančių prieš mediana. Čia vidutinės vertės yra 70 ir 70. Taigi Q1 = ((70 + 70) / 2) = 70.
  5. 5 Apskaičiuokite viršutinį kvartilį. Ši vertė, vadinama Q3, viršija 25% duomenų rinkinio verčių. Q3 apskaičiavimo procesas yra panašus į Q1 skaičiavimo procesą, tačiau čia atsižvelgiama į vertes po mediana.
    • Aukščiau pateiktame pavyzdyje du šešių vidurkiai po medianos yra 71 ir 72. Taigi Q3 = ((71 + 72) / 2) = 71,5.
  6. 6 Apskaičiuokite tarpkvartilinį diapazoną. Apskaičiavus Q1 ir Q3, būtina rasti atstumą tarp šių verčių. Norėdami tai padaryti, atimkite Q1 iš Q3. Tarpkvartilinio diapazono vertė yra labai svarbi nustatant verčių, kurios nėra pašalinės, ribas.
    • Mūsų pavyzdyje Q1 = 70 ir Q3 = 71,5. Tarpkvartilinis diapazonas yra 71,5 - 70 = 1,5.
    • Atminkite, kad tai taip pat taikoma neigiamoms Q1 ir Q3 reikšmėms. Pvz., Jei Q1 = -70, tarpkvartilinis diapazonas yra 71,5 -(-70) = 141,5.
  7. 7 Raskite duomenų rinkinio reikšmių „vidines ribas“. Nuokrypiai nustatomi analizuojant vertes- ar jos nepatenka į vadinamąsias „vidines ribas“ ir „išorines ribas“. Vertė, esanti už „vidinių ribų“, yra klasifikuojama kaip „nedidelė ribinė vertė“, o vertė, esanti už „išorinių ribų“, priskiriama „reikšmingiems nukrypimams“. Norėdami rasti vidines ribas, turite padauginti tarpkvailių diapazoną iš 1,5; rezultatas turi būti pridėtas prie Q3 ir atimtas iš Q1. Du rasti skaičiai yra vidinės duomenų rinkinio ribos.
    • Mūsų pavyzdyje tarpkvartilinis diapazonas yra (71,5–70) = 1,5. Toliau: 1,5 * 1,5 = 2,25. Šis skaičius turi būti pridėtas prie Q3 ir atimtas iš Q1, kad būtų galima rasti vidines ribas:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Taigi vidinės ribos yra 67,75 ir 73,75.
    • Mūsų pavyzdyje tik krosnies temperatūra - 300 laipsnių - yra už šių ribų ir gali būti laikoma nereikšminga emisija. Tačiau neskubėkite daryti išvadų - turime nustatyti, ar ši temperatūra yra reikšminga nuokrypis.
  8. 8 Raskite duomenų rinkinio „išorines ribas“. Tai daroma taip pat, kaip ir vidinėms riboms, išskyrus tai, kad tarpkvartilinis diapazonas padauginamas iš 3, o ne 1,5. Rezultatas turi būti pridėtas prie Q3 ir atimtas iš Q1. Du rasti skaičiai yra išorinės duomenų rinkinio ribos.
    • Mūsų pavyzdyje padauginkite tarpkvartilinį diapazoną iš 3: 1,5 * 3 = 4,5. Apskaičiuokite išorines ribas:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Taigi išorinės ribos yra 65,5 ir 76.
    • Bet kokios vertės, kurios nepatenka į išorines ribas, laikomos didelėmis emisijomis. Mūsų pavyzdyje 300 laipsnių krosnies temperatūra laikoma reikšmingu išpūtimu.
  9. 9 Naudokite kokybinį įvertinimą, kad nustatytumėte, ar nukrypimai turėtų būti pašalinti iš duomenų rinkinio. Aukščiau aprašytas metodas leidžia nustatyti, ar kai kurios vertės yra nepageidaujamos (nedidelės ar reikšmingos). Vis dėlto nesuklyskite - reikšmė, kuri klasifikuojama kaip pašalinė, yra tik „kandidatas“ į išimtį, tai reiškia, kad jums jos nereikia išskirti. Išsiskyrimo priežastis yra pagrindinis veiksnys, turintis įtakos sprendimui neįtraukti pašalinio. Paprastai neįtraukiami nukrypimai, atsirandantys dėl klaidų (matuojant, įrašant ir tt). Kita vertus, nukrypimai, susiję ne su klaidomis, bet su nauja informacija ar tendencija, paprastai paliekami duomenų rinkinyje.
    • Taip pat svarbu įvertinti nukrypimų poveikį duomenų rinkinio mediana (ar jie jį iškraipo, ar ne). Tai ypač svarbu, kai darote išvadas iš duomenų rinkinio medianos.
    • Mūsų pavyzdyje labai mažai tikėtina, kad orkaitė įkaista iki 300 laipsnių temperatūros (nebent atsižvelgsime į natūralias anomalijas). Todėl galima daryti išvadą (su dideliu tikrumu), kad tokia temperatūra yra matavimo klaida, kurią reikia pašalinti iš duomenų rinkinio. Be to, jei neatmetate nuokrypio, duomenų rinkinio mediana bus (69 + 69 + 70 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 laipsniai, bet jei neįtrauksite nuokrypio, mediana bus (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 laipsnių.
      • Nuokrypiai dažniausiai atsiranda dėl žmogaus klaidos, todėl pašalinius duomenis reikia pašalinti iš duomenų rinkinių.
  10. 10 Supraskite (kartais) duomenų rinkinyje paliktų nukrypimų svarbą. Kai kurie nukrypimai turėtų būti neįtraukti į duomenų rinkinį, nes jie atsiranda dėl klaidų ir techninių problemų; kiti nukrypimai turėtų būti palikti duomenų rinkinyje. Jei, pavyzdžiui, nukrypimas nėra klaidos rezultatas ir (arba) suteikia naują supratimą apie tiriamą reiškinį, jis turėtų būti paliktas duomenų rinkinyje. Moksliniai eksperimentai yra ypač jautrūs pašaliniams rodikliams - klaidingai pašalinus pašalinius dalykus, galite praleisti naują tendenciją ar atradimą.
    • Pavyzdžiui, mes kuriame naują vaistą, skirtą padidinti žuvų dydį žuvininkystėje. Mes naudosime seną duomenų rinkinį ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), tačiau šį kartą kiekviena vertė parodys žuvies svorį (gramais) po nurijimo eksperimentinis vaistas. Kitaip tariant, pirmasis vaistas padidina žuvų svorį iki 71 g, antrasis vaistas - iki 70 g ir pan. Esant tokiai situacijai, 300 yra reikšmingas nukrypimas, tačiau neturime to atmesti; jei darytume prielaidą, kad nebuvo matavimo klaidų, tada toks nukrypimas yra didelė eksperimento sėkmė. Vaistas, padidinęs žuvies svorį iki 300 gramų, veikia daug geriau nei kiti vaistai; taigi 300 yra svarbiausia duomenų rinkinio vertė.

Patarimai

  • Kai randami nukrypimai, pabandykite paaiškinti jų buvimą prieš pašalindami juos iš duomenų rinkinio. Jie gali nurodyti matavimo klaidas ar pasiskirstymo anomalijas.

Ko tau reikia

  • Skaičiuotuvas