Koncept kriterija pristanka. Kriterij kriterij suglasnosti je suglasnost je

Kada analizira varijacijske retke distribucije, ima mnogo važnije empirijska distribucija Simptom odgovara normalan, Za ovu učestalost stvarne raspodjele potrebno je usporediti s teoretskim koji su karakteristični za normalnu distribuciju. Dakle, potrebno je izračunati teorijske frekvencije normalne krivulje raspodjele, koje su funkcija normaliziranih odstupanja.

Drugim riječima, krivulja empirijske distribucije mora biti poravnana normalnom krivuljom raspodjele.

Objektivna svojstva sukladnosti teorets i empirijski frekvencija može se dobiti pomoću posebnih statističkih pokazatelja kazneni kriteriji.

Kriterij pristanka Nazovite kriterij koji vam omogućuje da utvrdite je li odstupanje empirijski i teorijski Distribucija slučajna ili značajna, da li su ta zapažanja u skladu s nominiranom statističkom hipotezom ili nisu dosljedne. Distribucija opće populacije, koja se proteže zbog hipoteze, naziva se teorijski.

Postoji potreba za uspostavljanjem kriterij (Pravilo), koje bi procijenilo jesu li razliku između empirijskih i teorijskih distribucija slučajna ili značajna. Ako će biti odstupanja slučajanVjeruje se da su ta zapažanja (uzorci) u skladu s hipotezom o zakonu distribucije opće populacije i stoga se uzima hipoteza; Ako će biti odstupanja smislen, ta opažanja nisu u skladu s hipotezom i odbacuju ga.

Obično empirijske i teorijske frekvencije razlikuju se zbog činjenice da:

  • slučajno i povezano s ograničenim brojem opažanja;
  • odstupanja nije slučajna i objašnjava se činjenicom da je statistička hipoteza da se opća populacija normalno distribuira - pogrešna.

Tako, kriteriji suglasnosti Dopušteno odbiti ili potvrditi ispravnost hipoteze o prirodi distribucije u empirijskom retku.

Empirijske frekvencije Primiti kao rezultat promatranja. Teorijske frekvencije Izračunajte formulama.

Za Zakon o normalnoj distribuciji Mogu se naći na sljedeći način:

  • Σƒ iznos akumuliranih (kumulativnih) empirijskih frekvencija
  • h - razlika između dvije susjedne opcije
  • σ - selektivna rms devijacija
  • t-uparen (standardizirano) odstupanje
  • φ (t) --funkcija gustoće vjerojatnosti normalne distribucije (pronađeno za odgovarajuću vrijednost t)

Postoji nekoliko kriterija pristanka, od kojih su najčešći: Cheri-Square (Pearson) kriterij, Kolmogorov kriterij, romarovski kriterij.

Kriteriji za pristanak Pearson χ 2 - jedan od glavnih, koji se može zastupati kao zbroj omjera kvadrata odstupanja između teorijskih (f t) i empirijskih (F) frekvencija na teorijske frekvencije:

  • k-broj skupina na koje je slomljena empirijska distribucija,
  • f I. - Vjerojatna učestalost znaka u I-TH grupi,
  • f t. -Oretička frekvencija.

Za distribuciju χ 2 kompilira se tablica, gdje je ključna vrijednost kriterija pristanka χ 2 naznačena za odabranu razinu značajnosti α i stupnjeva slobode DF (ili ν).
Razina značajnosti α je vjerojatnost pogrešnog odstupanja hipoteze, tj. Vjerojatnost da će ispravna hipoteza biti odbijena. R - statističko povjerenje Preuzimanje istinske hipoteze. U statistici se najčešće koriste tri razine značaja:

α \u003d 0,10, zatim p \u003d 0,90 (u 10 slučajeva od 100)

α \u003d 0,05, zatim p \u003d 0,95 (u 5 slučajeva od 100)

α \u003d 0,01, zatim p \u003d 0,99 (u 1 slučaju od 100) može se odbiti ispravnu hipotezu

Broj stupnjeva slobode DF-a definiran je kao broj skupina u nizu distribucije minus broj priključaka: DF \u003d K -Z. Pod brojem linkova znači broj pokazatelja empirijske serije koja se koristi u izračunavanju teorijskih frekvencija, tj. Pokazatelji koji povezuju empirijske i teorijske frekvencije.Na primjer, kada poravnavanje normalne krivulje raspodjele, postoje tri veze.Stoga, kada se uskladikrivulja normalne distribucije Broj stupnjeva slobode definiran je kao DF \u003d K-3.Procijeniti značajnost, izračunata vrijednost se uspoređuje s tablom χ 2

S punom slučajnošću teorijskih i empirijskih distribucija χ 2 \u003d 0, inače χ 2\u003e 0. Ako je χ 2 tablica , Na određenoj razini značaja i broja stupnjeva slobode, hipoteza besmislice (slučajnost) odstupanja odbijaju.U slučaju χ 2< χ 2 табл то hipoteza je prihvaćena i s vjerojatnošću p \u003d (1-α) može se tvrditi da je odstupanja između teorijskih i empirijskih frekvencija slučajna. Stoga je razlog da kažem da se empirijska distribucija pokorava Normalna distribucija. Kriterij suglasnosti Pearsonovog se koristi ako je ukupni iznos prilično velik (n\u003e 50), dok učestalost svake skupine mora biti najmanje 5.

Na temelju određivanja maksimalne razlike između akumuliranih empirijskih i teorijskih frekvencija:

gdje je D i D, odnosno maksimalna razlika između akumuliranih frekvencija i akumuliranih frekvencija empirijskih i teorijskih distribucija.
Prema Colmogorov statistici za distribuciju statistike, vjerojatnost koja može varirati od 0 do 1. kada je p (λ) \u003d 1-, frekvencija slučajnost, P (λ) \u003d 0 je potpuna razlika. Ako je vjerojatnost P značajna u odnosu na pronađenu vrijednost λ, može se pretpostaviti da je nepodudarnost između teorijskih i empirijskih distribucija beznačajna, to jest slučajna.
Osnovni uvjet za korištenje Kolmogorov kriterij je prilično veliki broj opažanja.

Kriterij za pristanak Kolmogorova

Razmotrite kako se Kolmogorov kriterij (λ) primjenjuje na provjera hipoteze o normalnoj distribuciji Opći agregat.Poravnavanje stvarne raspodjele od strane normalne krivulje raspodjele sastoji se od nekoliko faza:

  1. Usporedite stvarne i teorijske frekvencije.
  2. Prema stvarnim podacima određuju se teorijske frekvencije normalne krivulje raspodjele, što je funkcija normaliziranog odstupanja.
  3. Provjerite koliko raspodjela značajke odgovara normalnom.

ZaIvstupci tablice:

U MS Excelu, normalizirana devijacija (t) izračunava se pomoću funkcije normalizacije. Potrebno je istaknuti raspon slobodnih stanica po broju opcija (redaka proračunske tablice). Bez uklanjanja odabira, nazovite funkciju normalizacije. U dijaloškom okviru koji se pojavljuje, navedite sljedeće ćelije, u kojima su postavljene, odnosno, opažene vrijednosti (x i), srednja vrijednost (X) i standardno odstupanje ϭ. Rad mora biti dovršen istodobna Pritisnite tipke Ctrl + Shift + Enter

ZaVlanstupci tablice:

Funkcija gustoće vjerojatnosti normalne distribucije φ (t) nalazimo tablicu vrijednosti lokalne laplace funkcije za odgovarajuću vrijednost normaliziranog odstupanja (t)

ZaVistupci tablice:

Kriterij suglasnosti naziva se kriterij značajnosti koji se koristi za testiranje hipoteze o zakonu distribucije opće populacije, iz kojeg se uzima uzorak.

Najčešće je istraživač zainteresiran je li raspodjela eksperimentalnih podataka istinita. Stoga će primjeri biti povezani s provjerom eksperimentalne raspodjele na normalnosti.

  • Kriterij Shapiro-Willow
  • Chi-kvadratni kriterij
  • Kriterij Lambda Kolmogorov-Smirnanova

Kriterij Shapiro-Willow

Uvjeti primjene: Uzorkovanje malog volumena

H 0 - raspodjela opće populacije od kojih se dobiva uzorak agregata odgovara normalnom zakonu.

H1 je distribucija opće populacije od kojih se dobiva uzorak agregata ne u skladu s normalnim zakonom.

Tablica 1 - Algoritam za izračunavanje kriterija Shapiro-Willow.

x.x.ΔK.k.ank.ankΔk.
1 2 3 4 5 6 7
1 11,8 13,8 2 1 0,5739 1,1478
2 12 13,2 1,2 2 0,3291 0,39492
3 12,1 13 0,9 3 0,2141 0,19269
4 12,3 12,8 0,5 4 0,1224 0,0612
5 12,6 12,6 0 5 0,0399 0
6 12,6 12,6
7 12,8 12,3 Iznos \u003d b \u003d 17966
8 13 12,1
9 13,2 12
10 13,8 11,8

Postupak izračuna kriterija Shapiro-Willow

  1. Formuliramo hipotezu o H 0 o sukladnosti raspodjele opće populacije, od kojih su podaci dobiveni normalnim zakonom. Dodjeljujemo razinu značajnosti α \u003d 0,05.
  2. Dobivamo uzorak eksperimentalnih podataka (tablica 1). U našem slučaju n \u003d 10.
  3. Izračunajte vrijednost selektivne disperzije. Na primjer s 2 \u003d 0, 37.
  4. Uzorkovanje raspona u povećanju i silaznom redoslijedu (stupci 2 i 3)
  5. Razmislite o razliku ΔK (stupac 5)
  6. Sa tablice 6 aplikacija (vidi V.S.Ivanov, 1990) Pronađite vrijednosti koeficijenata ANK-a (stupac 6)
  7. Nalazimo rad ANKΔK.
  8. Izračunati b \u003d akkΔk \u003d 1,7966
  9. Izračunajte vrijednost kriterija WF po formuli:
  1. Iz tablice. 7 aplikacija (vidi V.S. Ivanov, 1990) Pronađite kritičnu vrijednost kriterija Shapiro-Willowa za α \u003d 0,05 wcrit \u003d 0.842.
  2. Izlaz. Od WF\u003e WD se može reći da su eksperimentalni podaci u skladu s normalnim zakonom na razini značaja od 0,05.

Chi-kvadratni kriterij

Dizajniran Karl Pearson, Temelji se na izgradnji intervala varijacije i uspoređujući empirijske (n em) i teorijske (n T) frekvencije (sl. 1).

Sl. 1. Histogram koji karakterizira empirijsku distribuciju i funkciju gustoće vjerojatnosti normalne distribucije.

Statistička hipoteza: Gustoća raspodjele opće populacije, iz koje se uzima uzorak, odgovara teoretskom modelu normalne distribucije.

Vrijednost stvarnog CHI-Trga kriterija izračunava se formulom:

Ako je stvarna vrijednost kriterija CHI-kvadrata veća ili jednaka kritičnoj vrijednosti kriterija CHI-Square, može se zaključiti da se empirijska distribucija ne pridržava normalnog zakona na razini značajnosti α.

Kriterij Lambda Kolmogorov-Smirnanova

Dizajniran od strane Andrey Nikolaevich Kolmogorov I Nikolai Vasilyevich Smirnov.

Statistička hipoteza: Funkcija distribucije opće populacije (sl. 2), iz kojih se uzima uzorak, odgovara funkciji raspodjele normalnog prava.

Slika 2. Crvene točkice - kumulat, izgrađen na temelju eksperimentalnih podataka, plava krivulja je teoretska distribucijska funkcija (normalna distribucija).

Vrijednost kriterija λ F se izračunava formulom:

Zaključak: Ako je λ f\u003e λ Kreta je empirijska distribucija ne odgovara normalnom Na razini značajnosti α.

KNJIŽEVNOST

  1. Veća matematika i matematička statistika: Tutorial za sveučilišta / Ukupno. ed. G. I. Popova. - M. Fizička kultura, 2007.- 368 str.
  2. Osnove matematičke statistike: tutorial za in-tov piz. Kult / ed. V.S. Ivanova. - m.: Tjelesno obrazovanje i sport, 1990. 176 str.

Budući da su sve pretpostavke o prirodi određene distribucije hipoteze, a ne kategoričke izjave, onda se prirodno moraju podvrgnuti statističkoj provjeri uz pomoć takozvanih kriterija pristanka.

Kriteriji suglasnosti, na temelju utvrđenog zakona distribucije, omogućuju utvrđivanje kada se odstupanja između teorijskih i empirijskih frekvencija treba smatrati beznačajnim (slučajnim), a kada su značajni (nesumcinski). Dakle, kriteriji suglasnosti omogućuju odbacivanje ili potvrđivanje ispravnosti hipoteze nominirane tijekom poravnanja

na prirodi distribucije u empirijskoj seriji i daju odgovor, moguće je usvojiti za ovu empirijsku raspodjelu model izražen nekim teorijskim zakonom distribucije.

Postoji niz kriterija za pristanak. Češće se koriste kriteriji Pearson, Romanovsky i Kolmogorov. Razmotriti ih.

Kriterij za suglasnost Pearson% 2 (CHI-Square) je jedan od glavnih kriterija suglasnosti. Kriterij je predložio engleski matematičar Karl Pearson (1857-1936) kako bi se procijenila slučajnost (materijalnost) odstupanja između frekvencija empirijskih i teorijskih distribucija. Pearsonov kriterij gdje

broj skupina na kojima je slomljena empirijska distribucija;

uočena učestalost znaka u I-TH skupini; Teoretska frekvencija izračunata na navodnoj raspodjeli. Za distribuciju Y), tablica je sastavljena, gdje je kritična vrijednost kriterija suglasnosti naznačena za odabranu razinu značajnosti A i s obzirom na broj stupnjeva slobode V (vidi Dodatak 4).

Razina značajnosti A je vjerojatnost pogrešnog odstupanja hipoteze, tj. Vjerojatnost da će ispravna hipoteza biti odbijena. U statističkim studijama, ovisno o važnosti i odgovornosti riješenih zadataka, koriste se sljedeća tri razine značajnosti: 1)

a \u003d 0.10, zatim p \u003d 0,90; 2)

a \u003d 0,05, zatim p \u003d 0,95; 3)

a \u003d 0.01, zatim p \u003d 0,99.

Na primjer, vjerojatnost 0,01 znači da se u jednom slučaju ispravna hipoteza može odbaciti od 100. U ekonomskim studijama, smatra se gotovo prihvatljiva pogreška 0,05, tj. U 5 slučajeva, ispravna hipoteza može se odbiti od 100.

Osim toga,% od 2 kriterija definiranog u tablici ovisi o broju stupnjeva slobode. Broj stupnjeva slobode V definiran je kao broj skupina u nizu distribucije na minus broj priključaka s v

Pod brojem linkova znači broj pokazatelja empirijske serije koji se koriste u izračunu teorijskih frekvencija, tj. Pokazatelji koji povezuju empirijsku i teoretsku / l

frekvencija

Dakle, u slučaju poravnanja na normalnoj krivulji raspodjele, postoje tri veze:

x ~ x "" SU \u003d a "* x sh \u003d y

EMF Theor 'EMP teore\u003e ^ 1emp ^ / teorem *

Stoga, kada je usklađen s normalnom krivuljom raspodjele, broj stupnjeva slobode definiran je kao v \u003d K - 3, gdje je K broj skupina u nizu.

U slučaju poravnanja na Poisson krivulji V \u003d K - 2, budući da se koristeći frekvencije, koriste se dvije ograničavajuće veze: X, 1TG /

Da bi se procijenila materijalnost, izračunata vrijednost% 2 uspoređuje se sa tablicom% 2Tabl.

Uz potpunu slučajnost teorijskih i empirijskih distribucija% 2 \u003d 0, inače% 2\u003e 0.

Ako je Chricanch\u003e Xtable 't0 na određenoj razini značaja i i broj stupnjeva slobode v hipoteze o gluposti (slučajnost) odstupanja odbijanja.

Ako% jezika ^ x2table "zaključiti da je empirijska serija dobro u skladu s hipotezom o predloženoj distribuciji i s vjerojatnošću (1 - a) može se tvrditi da je odstupanje između teorijskih i empirijskih frekvencija slučajna.

Koristeći kriterij pristanka? 2, moraju se promatrati sljedeći uvjeti: 1)

volumen ukupnosti u studiji trebao bi biti dovoljno velik (uu\u003e 50), dok frekvencija ili broj svake skupine treba biti najmanje 5.

Ako je ovo stanje slomljeno, potrebno je prethodno kombinirati male frekvencije; 2)

empirijska distribucija mora se sastojati od podataka dobivenih kao rezultat slučajnog odabira, tj. Moraju biti neovisni.

Ako je u empirijskom redu, distribucija je postavljena općim / t.

tada se y) treba izračunati formulom

Kriterij Republike Romanov Kirgiji temelji se na korištenju PARSON kriterija% 2, tj. Već pronađene vrijednosti% 2, a broj stupnjeva slobode V:

Vrlo je zgodan u odsutnosti tablica za% 2.

Ako cr 3, onda nije slučajno

i, prema tome, teoretska distribucija ne može poslužiti kao model za empirijsku raspodjelu u studiju.

Kolmogorov X Kriterij se temelji na određivanju maksimalne razlike između akumuliranih frekvencija ili skupina empirijskih i teorijskih distribucija:

X \u003d -2 \u003d ili x \u003d, u

gdje je Dud, odnosno, maksimalna razlika između akumuliranih frekvencija (F-F ") i između akumuliranih

skupine (p - r ") empirijskih i teorijskih redova distribucija;

N je broj jedinica u agregatu.

Izračunavanje vrijednosti X, prema tablici P (k) (vidi Dodatak 6) odrediti vjerojatnost s kojom se može tvrditi da odstupanja empirijskih frekvencija s teorijskog slučajnog. Vjerojatnost p (k) može varirati od 0 do 1. Kada se p (k) \u003d 1 pojavljuje se frekvencija, kada je p (k) \u003d 0 - potpuno odstupanje. Ako A, uzima vrijednosti do 0,3, zatim p (k) \u003d 1.

Osnovni uvjet za korištenje Kolmogorov kriterij je prilično velik broj opažanja.

Primjer. Pomoću tablice podataka. 5.17, kako bi se provjerila ispravnost hipoteze distribucije roka Distrikta prema zakonu normalne distribucije. Vrijednosti potrebne za izračunavanje kriterija suglasnosti daju se u tablici. 5.19.

Tablica 5.19.

Izračun vrijednosti za određivanje kriterija za suglasnost Pearson X2 i Kolmogorov X rasta, vidi učestalost niza distribucije (/ p - t ") 2 t" ff "KR, TT" A 1 2 3 4 5 6 156-160 8 5 1, 8 8 5 3 161-165 17 16 0,1 25 21 4 166-170 42 40 0,1 67 61 6 171-175 54 65 1,121 126 5 176-180 73 73 0 194 199 5 181- 185 57 57 0 251 256 5 186-190 38 30 2.1 289 286 3 191-195 11 11 0 300 297 3 x 300 297 6.0 Prvo, prvo izračunamo kriterij

Zatim odaberite razinu značajnosti A \u003d 0.05 i određujemo broj stupnjeva slobode V. U ovoj raspodjeli 8 skupina, a broj priključaka (parametri) je 3, dakle, v \u003d 8 - 3 \u003d 5. Prema Tablica Dodatka 4, naći ćemo na a \u003d 0, 05 i v \u003d 5 Pearson Kriterij% 2 \u003d 11.07.

Budući da je% 2RC provjeriti hipotezu proširena pomoću romarovskog kriterija:

I x2 - v i 16.0 - 5 i 1

kR \u003d] r \u003d ^ \u003d 1 \u003d - V \u003d 0.3.

Budući da je kriterij Romanovskog također potvrđuje da su odstupanja između empirijskih i teorijskih frekvencija beznačajna.

Sada razmatramo primjenu kriterija Kolmogorov a. Kao što se može vidjeti iz tablice. 5.19, maksimalna razlika između kumulativnih frekvencija je 6, tj. B \u003d shah! / 1- p "\u003d 6. Zbog toga Kolmogorov kriterij

X \u003d - \u003d \u003d \u003d 0,35.

Prema tablici Dodatka 6 nalazimo vrijednost vjerojatnosti na X \u003d 0,35: p (x) \u003d 0,9977. To znači da s vjerojatnošću blizu jednog, može se tvrditi da hipoteza normalne distribucije ne odbacuje, a razlike empirijske i teorijske raspodjele su slučajne.

Sada, potvrđujući ispravnost hipoteze proširena uz pomoć poznatih kriterova, rezultati distribucije mogu se koristiti za praktične aktivnosti.

Primjer. Pomoću tablice podataka. 5.18, provjerite hipotezu o podnošenju raspodjele broja grešaka u automobilima od strane zakona Poissona.

Početni podaci i izračun vrijednosti potrebnih za određivanje kriterija suglasnosti prikazani su u tablici. 5.20.

Izračunajte vrijednost% 2: 2

Dfasch ^ / 9

(Vidi tablicu 5.20). Hhtor \u003d 9\u003e 49

(Vidi Dodatak 4).

Budući da se% 2rch tako iznijela hipoteza o raspodjeli broja grešaka u automobilima prema zakonu Poissona ne odbacuje se.

Obrada neovisnih mjerenja slučajne varijable ξ, možemo izgraditi statističku funkciju distribucije F * (x). Prema toj funkciji, možete preuzeti hipotezu da je prava teorijska funkcija distribucije f (x). Nezavisna mjerenja (X 1, X 2, ..., X N) formiranje uzorka mogu se smatrati jednako raspodijeljenim slučajnim varijablama s hipotetskom funkcijom distribucije F (X).

Očito će biti nekih odstupanja između funkcija F * (x) i F (x). Pojavljuje se pitanje - bilo da su te razlike posljedica ograničenog volumena uzorkovanja ili su povezane s činjenicom da naša hipoteza nije ispravna, tj. Stvarna funkcija distribucije nije f (x), ali neki drugi. Da biste riješili ovo pitanje, uživajte u kriterijima suglasnosti, čija suština je sljedeća. Odabrana je određena vrijednost δ (f, f *), koja karakterizira stupanj neslaganja između funkcija F * (x) i F (x). Na primjer, δ (f, f *) \u003d sup | f (x) -f * (X) |, tj. Gornje lice X-razlika modula.

S obzirom na hipotezu vjerni, tj. Znajući funkciju distribucije F (x), moguće je pronaći zakon distribucije slučajne varijable Δ (f, f *) (pitanje, kako to učiniti, nećemo dirati). Postavimo broj p 0 tako mali da je provedba događaja (δ (F, f *)\u003e δ 0) s tom vjerojatnošću će se smatrati gotovo nemogućim. Iz stanja

pronađite vrijednost δ 0. Ovdje je (x) gustoća raspodjele Δ (f, F *).

Sada se sada izračunava vrijednost δ (f, f *) \u003d δ 1 rezultatima

uzorci, tj. Pronašli smo jednu od mogućih vrijednosti slučajne varijable Δ (f, f *). Ako δ 1 ≥δ 0, onda to znači da je došlo do gotovo nemoguće događaj. To se može objasniti činjenicom da naša hipoteza nije istinita. Dakle, ako δ 1 ≥δ 0, tada se hipoteza odbacuje, a na 8 1<Δ 0 , гипотеза может оказаться неверной, но вероятность этого мала.

Kao mjera odstupanja Δ (f, f *), možete poduzeti različite vrijednosti. Ovisno o tome dobivaju se različiti kriteriji pristanka. Na primjer, kriterij za suglasnost Kolmogorov, Mises, Pearson ili Chi-kvadrat kriterije.

Neka rezultati N mjerenja su uređena u obliku grupirane statističke serije s k dischases.

Ispuštanje (x 0, X 1) (u stvari, pretpostavljamo da se mjerne pogreške ravnomjerno raspoređuju na nekom segmentu). Tada će biti jednaka vjerojatnost da će svaka od sedam znamenki biti jednaka. Koristeći grupirani redak iz §11, izračunati δ (F, F *) \u003d δ 1 \u003d po formuli (1). U ovom slučaju .

Budući da hipotetički zakon o distribuciji uključuje dva nepoznata parametre, α i β - početak i kraj segmenta, broj stupnjeva slobode će biti 7-1-2 \u003d 4. Prema Chi-kvadratnom raspodjelu tablice na vjerojatnosti vjerojatnosti p 0 \u003d 10 -3, nalazimo δ 0 \u003d 18. Jer Δ 1\u003e δ 0, tada će se morati odbaciti hipotezu o jedinstvenoj raspodjeli pogreške mjerenja.

Nula (glavni) Oni nazivaju hipotezu iznesenu na oblik nepoznate distribucije ili na parametrima poznatih distribucija. Konkurentan (alternativa) Oni nazivaju hipotezu koja proturječi nuli.

Na primjer, ako nula hipoteza pretpostavlja da je slučajna vrijednost X. Distribuirana zakonom, konkurentska hipoteza može se sastojati u pretpostavci da je slučajna vrijednost H. Raspodijeljen na drugom zakonu.

Statistički kriterij (ili jednostavno kriterij) Nazovite neki slučajni iznos DOkoji služi za testiranje nule hipoteze.

Nakon odabira određenog kriterija, na primjer, kriterij, skup svih njegovih mogućih vrijednosti podijeljeni su u dvije podskupe ne-ciklusa: jedan od njih sadrži vrijednosti kriterija na kojima se odbacuje nula hipoteza i drugi - s kojim je prihvaćen.

Kritična regija Nazovite skup vrijednosti kriterija na kojem se odbacuje nula hipoteza. Područje usvajanja hipoteza Nazovite skup vrijednosti kriterija u kojem se uzima hipoteza. Kritične točke Pozivne točke odvajaju kritično područje iz područja uzimanja nule hipoteze.

Za naš primjer, vrijednost izračunata uzorom odgovara području usvajanja hipoteze: slučajna varijabla se distribuira po zakonu. Ako je izračunata vrijednost ulazi u kritično područje, to jest, hipoteza o raspodjeli slučajne varijable je odbačena zakonom.

U slučaju distribucije, kritično područje određuje nejednakost, područje uzimanja nule hipoteze je nejednakost.

2.6.3. Kriterij pristanka Pearson.

Jedan od zadataka zootechnia i veterinarske genetike je uklanjanje novih pasmina i vrsta s potrebnim znakovima. Na primjer, poboljšanje imuniteta, otpornosti na bolesti ili promjenu boje krznenog pokrova.

U praksi, kada se analiziraju rezultate, često se ispada da su stvarni rezultati više ili manje u skladu s nekim teorijskim zakon o distribuciji. Postoji potreba za procjenom stupnja usklađenosti stvarnih (empirijskih) podataka i teorijskih (hipotetskih). Da biste to učinili, guraju nulu hipotezu: rezultirajući set se distribuira pod zakonom "a". Provjera hipoteze o navodnom zakonu o raspodjeli se vrši pomoću posebno odabrane slučajne varijable - kriterij pristanka.

Kriterij pristankapotvrditi kriterij za provjeru hipoteze o navodnom zakonu nepoznate distribucije.

Postoji nekoliko kriterija za pristanak: Pearson, Kolmogorov, Smirnova i D.R. Najčešće se koristi kriterij Pearsonovog pristanka.

Razmotriti primjenu Pearson kriterija na primjeru testa hipoteze o normalnom pravu raspodjele opće populacije. U tu svrhu usporedit ćemo empirijsku i teoretsku (izračunatu u nastavku normalne distribucije) učestalosti.

Obično postoji određena razlika između teorijskih i empirijskih frekvencija. na primjer:

Empirijske frekvencije 7 15 41 93 113 84 25 13 5

Teoretske frekvencije 5 13 36 89 114 91 29 14 6

Razmotrite dva slučaja:

Odstupanja između teorijskih i empirijskih frekvencija je slučajna (beznačajna), tj. Moguće je napraviti prijedlog za raspodjelu empirijskih frekvencija u skladu s normalnim zakonom;

Odstupanja između teorijskih i empirijskih frekvencija nije slučajnost (značajno), tj. Izračunavaju se teorijske frekvencije, na temelju netočne hipoteze o normalnoj raspodjeli opće populacije.

Uz pomoć kriterija, suglasnost Pearsona može se odrediti slučajno ili bez razlike između teorijskih i empirijskih frekvencija, tj. Uz određenu vjerojatnost pouzdanosti, distribuira se općem agregatu prema normalnom zakonu ili ne.

Dakle, ako je uzorak volumena N dobivene empirijske distribucije:

Mogućnosti ......

Empirijske frekvencije .......

Pretpostavimo da se teorijske frekvencije izračunavaju pod namjeravanom raspodjelom. U razini značajnosti potrebno je provjeriti nultu hipotezu: opća populacija se distribuira normalno.

Kao kriterij za provjeru nulte hipoteze, snimit ćemo slučajni iznos

(*)

Ova vrijednost je slučajna, jer u različitim eksperimentima potrebno je razne, unaprijed nepoznate vrijednosti. Jasno je da se manje empirijske i teorijske frekvencije razlikuju, što je manje vrijednost kriterija i stoga u određenoj mjeri karakterizira blizinu empirijskih i teorijskih distribucija.

Dokazano je da sa zakonom distribucije slučajne varijable (*), bez obzira na to kako zakon distribucije podliježe općoj populaciji, nastoji zakon distribucije stupnjeva slobode. Stoga je slučajna vrijednost (*) označena, a samo se kriterij naziva kriterij suglasnosti "chi-kvadrat".

Označava vrijednost kriterija izračunatog prema promatranju podataka, kroz. Obilne kritične vrijednosti kriterija za ovu razinu značajnosti i broj stupnjeva slobode označene su. U ovom slučaju, broj stupnjeva slobode određuje se iz jednakosti, gdje je broj skupina (djelomični intervali) uzorkovanja ili nastave; - broj parametara navodne raspodjele. U normalnoj distribuciji, dva parametra - matematičko očekivanje i sekundarno kvadratno odstupanje. Stoga se broj stupnjeva slobode za normalnu raspodjelu nalazi iz jednakosti

Ako se nejednakost provodi za izračunatu vrijednost i tablicu Zero hipoteza se uzima na normalnu raspodjelu opće populacije. Ako Zero hipoteza odbacuje i preuzimaju alternativu hipoteza (opći agregat nije distribuiran u skladu s normalnim zakonom).

Komentar. Pri korištenju kriminalne kriterije Pearsona, volumen uzorka mora biti najmanje 30. Svaka skupina mora sadržavati najmanje 5 opcija. Ako u skupinama ima manje od 5 frekvencija, kombiniraju se sa susjednim skupinama.

U općem slučaju, broj stupnjeva slobode za distribuciju CHI kvadrata definirana je kao ukupan broj vrijednosti za koje se izračunavaju odgovarajući pokazatelji, minus broj tih uvjeta koji vežu ove vrijednosti, tj. Smanjiti mogućnost varijacije između njih. U najjednostavnijim slučajevima, kada će izračunati broj stupnjeva slobode biti jednak broju nastave smanjene za jedan. Na primjer, u dihibrid, cijepanje, stupanj 4, ali ne samo prvi razred se dobiva, naknadni su već povezani s prethodnim. Stoga, za dihibrid cijepanje, broj stupnjeva slobode.

Primjer 1. Odredite stupanj usklađenosti stvarne raspodjele skupina po broju bolesnika s kravama tuberkuloze s teoretski očekivanim, koji je izračunat pri razmatranju normalne distribucije. Izvorni podaci se reduciraju na tablicu:

Odluka.

U pogledu značajnosti i broja stupnjeva slobode od tablice kritičnih distribucijskih točaka (vidi Dodatak 4) Pronašli smo vrijednost , Ukoliko , Može se zaključiti da je razlika između teorijskih i stvarnih frekvencija slučajna. Dakle, stvarna raspodjela skupina u broju bolesnika s kravljem tuberkuloze odgovara teoretično očekivanoj.

Primjer 2. Teoretska distribucija kroz fenotip pojedinaca dobivenih u drugoj generaciji u dihibridnom prijelazu zečeva prema Mendelovom zakonu je 9: 3: 3: 1. Potrebno je izračunati korespondenciju empirijske distribucije kunića iz prelaska crnih osoba Normalna vuna s umirućim životinjama - Albinos. Prilikom prelaska u drugoj generaciji dobiveno je 120 potomka, uključujući 45 crni s kratkom vunom, 30 crni down, 25 bijela s kratkom vunom, 20 bijelih obojenih kunića.

Odluka. Teoretski, očekivani razdvajanje u potomstvu treba odgovarati omjeru od četiri fenotipova (9: 3: 3: 1). Izračunajte teorijske frekvencije (broj glava) za svaki razred:

9 + 3 + 3 + 1 \u003d 16, tako da možete očekivati \u200b\u200bda crni skrosk ; crno obojeno - ; Bijela mačka - ; Bijele padove -.

Empirijska (stvarna) raspodjela fenotipova bila je kako slijedi 45; trideset; 25; 20.

Sve ove podatke ćemo smanjiti na sljedeću tablicu:

Izračunava se pomoću kriterija Pearsonovog pristanka:

Broj stupnjeva slobode s dihibridnim prijelazom. Za značaj Pronaći važnost , Ukoliko , Može se zaključiti da je razlika između teorijskih i stvarnih frekvencija nije slučajna. Prema tome, dobivena skupina kunića odstupa raspodjelu fenotipova iz Mendelovog zakona s dihibridnim prijelazom i odražava učinak određenih čimbenika koji mijenjaju vrstu cijepanja duž fenotipa u drugoj generaciji prepreka.

Kriterij za pristanak Pearson Chi-trg može se koristiti za usporedbu s drugima dvije homogene empirijske distribucije, tj. Takve čije su iste granice razreda. Hipoteza jednakosti dviju nepoznatih distribucijskih funkcija uzima se kao nula hipoteza. Kriterij CHI-Square u takvim slučajevima određen je formulom

(**)

gdje su i su količine usporednih distribucija; i - frekvencije odgovarajućih klasa.

Razmotrite usporedbu dviju empirijskih distribucija na sljedećem primjeru.

Primjer 3. Promjena je provedena duljina jaja kukavica na dvije teritorijalne zone. U prvoj zoni ispitivan je uzorak od 76 jaja (), u drugoj od 54 (). Dobiveni su sljedeći rezultati:

Duljina (mm)
Frekvencija
Frekvencija - - -

Na razini značajnosti potrebno je provjeriti nultu hipotezu da oba uzorci jaja pripadaju jednoj populaciji kukavice.

Slični članci

2021 Rookame.ru. Građevinski portal.