Koncept kriterija saglasnosti. Pristanka kriterij kriterij je pristanak

Prilikom analize varijacijskih redova distribucije, ima mnogo važnije empirijska distribucija Simptom odgovara normalan. Za ovu učestalost stvarne distribucije potrebno je usporediti sa teorijskim osobama koje su karakteristične za normalnu distribuciju. Dakle, potrebno je izračunati teorijske frekvencije normalne distribucijske krivulje, što su funkcija normaliziranih odstupanja.

Drugim riječima, empirijska krivulja distribucije mora biti usklađena normalna krivulja distribucije.

Objektivna karakteristika sukladnosti teoretički i empirijski učestalost mogu se dobiti pomoću posebnih statističkih pokazatelja krivični kriterijumi.

Kriterij saglasnosti Pozovite kriterij koji vam omogućava da utvrdite da li je odstupanje empirijski i teorijski Raspodjela nasumična ili značajna, I.E. da li su ta zapažanja u skladu sa nominiranim statističkim hipotezama ili nisu dosljedni. Distribucija opće populacije, koja je zbog produženog hipoteze, naziva se teorijskim.

Postoji potreba za uspostavljanjem kriterij (Pravilo), koje bi sudile da li je odstupanje između empirijskih i teorijskih distribucija nasumično ili značajno. Ako će odstupanje biti nasumičan, vjeruje se da su ta zapažanja (uzorci) u skladu s hipotezom o zakonu distribucije opće populacije i, stoga se uzima hipoteza; Ako će odstupanje biti smislen, Ova zapažanja nisu u skladu sa hipotezom i odbacuju ga.

Obično se empirijske i teorijske frekvencije razlikuju zbog činjenice da:

  • nesreća slučajno i povezana je sa ograničenim brojem zapažanja;
  • odstupanje nije slučajno i objašnjava se činjenicom da je statistička hipoteza da se opća populacija normalno distribuira - pogrešna.

Na ovaj način, kriteriji saglasnosti Dozvoljeno je odbiti ili potvrditi ispravnost hipoteze o prirodi distribucije u empirijskom retku.

Empirijske frekvencije Primiti kao rezultat promatranja. Teorijske frekvencije Izračunati formulama.

Za Zakon normalne distribucije Mogu se naći na sljedeći način:

  • Σƒ i - količina akumuliranih (kumulativnih) empirijskih frekvencija
  • h - razlika između dvije susjedne opcije
  • Σ - selektivno odstupanje od RMS-a
  • t-ignorirano (standardizovano) odstupanje
  • φ (t) -funkcionalnost gustine vjerojatnosti normalne distribucije (pronađeno za odgovarajuću vrijednost t)

Postoji nekoliko kriterija saglasnosti, od kojih su najčešći: Cheri-Square (Pearson) kriterij, Kolmogorov kriterij, Romanovskog kriterija.

Kriteriji za saglasnost Pearson χ 2 - Jedan od glavnih, koji se može predstavljati kao zbroj omjera kvadrata razlika između teorijskih (f t) i empirijskih (f) frekvencija za teorijske frekvencije:

  • k-broj grupa na koje je empirijska distribucija slomljena,
  • f I. -Nabanjava frekvencija znaka u I-Thu grupi,
  • f T. -Teretičke frekvencije.

Za distribuciju χ 2 sastavljena je tablica, gdje je kritična vrijednost kriterija pristanka χ 2 naznačena za odabrani nivo značajnosti α i stupnjeva slobode DF (ili ν).
Razina značaja α je verovatnoća pogrešnog odstupanja hipoteze produžene, I.E. Vjerojatnost da će se tačna hipoteza biti odbijena. R - statističko samopouzdanje Uzimanje istinske hipoteze. U statistikama se najčešće koriste tri nivoa značaja:

α \u003d 0,10, a zatim p \u003d 0,90 (u 10 slučajeva od 100)

α \u003d 0,05, zatim p \u003d 0,95 (u 5 slučajeva od 100)

α \u003d 0,01, zatim p \u003d 0,99 (u 1 slučaju od 100) može se odbiti ispravna hipoteza

Broj stupnjeva slobode DF-a definiran je kao broj grupa u velikom broju distribucije minus broj priključaka: DF \u003d K -Z. Pod brojem veza znači broj pokazatelja empirijske serije koja se koristi u izračunavanju teorijskih frekvencija, I.E. Pokazatelji koji povezuju empirijske i teorijske frekvencije.Na primjer, prilikom poravnanja normalne krivulje distribucije postoje tri veze.Stoga, prilikom poravnanjakrivulja normalne distribucije Broj slobodnih stupnjeva definiran je kao DF \u003d K-3.Za procjenu materijalnosti, izračunata vrijednost se uspoređuje sa tablicom χ 2 kartica

Uz punu službu teorijskih i empirijskih distribucija χ 2 \u003d 0, u suprotnom χ 2\u003e 0. Ako je χ 2 q\u003e 2 tablica , na određenom nivou značaja i broju stupnjeva slobode, hipoteza gluposti (slučajnost) odstupanja odbijaju.U slučaju χ 2< χ 2 табл то hipoteza je prihvaćena i s vjerojatnošću P \u003d (1-α) može se tvrditi da je odstupanje između teorijskih i empirijskih frekvencija nasumično. Stoga postoji razlog da se kaže da empirijska distribucija služe Normalna distribucija. Kriterij Pearsonove saglasnosti koristi se ako je ukupni ukupni ukupni prilično velik (n\u003e 50), dok frekvencija svake grupe mora biti najmanje 5.

Na osnovu utvrđivanja maksimalne razlike između akumuliranih empirijskih i teorijskih frekvencija:

gde je D i D, najveća razlika između akumuliranih frekvencija i akumulirane frekvencije empirijskih i teorijskih distribucija.
Prema stolu za distribuciju Colmogorov, vjerovatnoća koja može varirati od 0 do 1. Kada je P (λ) \u003d 1-, frekvencijsku službu, P (λ) \u003d 0 je potpuna odstupanje. Ako je vjerojatnost P značajna u odnosu na pronađenu vrijednost λ, može se pretpostaviti da je odstupanje između teorijskih i empirijskih distribucija beznačajno, odnosno je slučajno.
Osnovni uvjet za korištenje kriterija Kolmogorov je prilično velik broj zapažanja.

Kriterij za saglasnost Kolmogorova

Razmislite kao da se kriterij Kolmogorov (λ) odnosi na provjera hipoteze o normalnoj distribuciji Opći agregat.Poravnavanje stvarne distribucije normalnom distribucijskom krivuljom sastoji se od nekoliko faza:

  1. Uporedite stvarne i teorijske frekvencije.
  2. Prema stvarnim podacima utvrđuju se teorijske frekvencije normalne distribucijske krivulje, što je funkcija normaliziranog odstupanja.
  3. Provjerite koliko raspodjela funkcije odgovara normalnoj.

ZaIVstolni stubovi:

U MS Excelu, normalizirano odstupanje (T) izračunava se pomoću funkcije normalizacije. Potrebno je istaknuti raspon slobodnih ćelija po broju opcije (redama proračunske tablice). Bez uklanjanja izbora, nazovite funkciju normalizacije. U dijaloškom okviru koji se pojavljuje, navedite sljedeće ćelije, u kojima se postavljaju, respektivno, promatrane vrijednosti (x i), srednje (x) i standardno odstupanje ϭ. Operacija mora biti završena istovremeno Pritisnite Ctrl + Shift + Enter tipke

ZaV.stolni stubovi:

Funkcija gustoće vjerojatnosti normalne distribucije φ (t) Pronalazimo tablicu vrijednosti lokalne laplace funkcije za odgovarajuću vrijednost normaliziranog odstupanja (t)

ZaVIstolni stubovi:

Kriterij saglasnosti naziva se kriterij značaja koji se koristi za testiranje hipoteze o zakonu distribucije opće populacije iz kojeg se uzima uzorak.

Najčešće je istraživač zainteresiran da li je distribucija eksperimentalnih podataka tačna. Stoga će primjeri biti povezani sa verifikacijom eksperimentalne distribucije na normalnosti.

  • Kriterijum Shapiro-Willow
  • Chi-kvadratni kriterij
  • Kriterijum Lambda Kolmogorov-Smirnova

Kriterijum Shapiro-Willow

Uvjeti primjene: uzorkovanje malog zapremine

H 0 - Distribucija opće populacije u kojem se dobija uzorak agregata odgovara normalnom zakonu.

H 1 je distribucija opće populacije u kojem se dobije uzorak agregata ne u skladu sa normalnim zakonom.

Tabela 1 - Algoritam za izračunavanje kriterija Shapiro-Willow.

x.x.Δk.k.aNK.ankδk.
1 2 3 4 5 6 7
1 11,8 13,8 2 1 0,5739 1,1478
2 12 13,2 1,2 2 0,3291 0,39492
3 12,1 13 0,9 3 0,2141 0,19269
4 12,3 12,8 0,5 4 0,1224 0,0612
5 12,6 12,6 0 5 0,0399 0
6 12,6 12,6
7 12,8 12,3 Iznos \u003d B \u003d 17966
8 13 12,1
9 13,2 12
10 13,8 11,8

Postupak izračunavanja kriterija Shapiro-Willow

  1. Formuliramo hipotezu H 0 o usklađenosti distribucije opće populacije, iz kojeg su podaci dobiveni normalnim zakonom. Dodijelimo nivo značajnosti α \u003d 0,05.
  2. Dobijamo uzorak eksperimentalnih podataka (stupac 1 Tabela 1). U našem slučaju n \u003d 10.
  3. Izračunajte vrijednost selektivne disperzije. Na primjer S 2 \u003d 0, 37.
  4. Raspon uzorkovanje u povećanju i silaznom redoslijedu (stupci 2 i 3)
  5. Razlikujemo razliku Δk (stupac 5)
  6. Iz tablice 6 aplikacija (vidi v.s.ivanov, 1990.) Pronađite vrijednosti ank koeficijenata (stupac 6)
  7. Pronalazimo rad ankck.
  8. Izračunajte B \u003d ankΔK \u003d 1,7966
  9. Izračunajte vrijednost kriterija WF po formuli:
  1. Iz tabele. 7 Prijave (vidi V. Ivanov, 1990.) Pronađite kritičnu vrijednost kriterija Shapiro-Willow za α \u003d 0,05 WSCIT \u003d 0.842.
  2. Izlaz. Budući da se WF\u003e WD može reći da su eksperimentalni podaci u skladu sa normalnim zakonom na nivou značaja od 0,05.

Chi-kvadratni kriterij

Dizajniran Karl Pearson. Temelji se na izgradnji intervalnih varijacijskih serija i uspoređujući empirijske (n em) i teorijske (N T) frekvencije (Sl. 1).

Sl.1. Histogram koji karakterizira empirijsku distribuciju i funkciju gustoće vjerojatnosti normalne distribucije.

Statistička hipoteza: Gustina raspodjele opće populacije iz kojeg se uzima uzorak, odgovara teorijskom modelu normalne distribucije.

Vrijednost stvarne kriterij Chi-kvadrata izračunava se formulom:

Ako je stvarna vrijednost kriterija Chi-kvadrata veća od ili jednaka kritičnoj vrijednosti kriterija Chi-kvadrata, može se zaključiti da empirijska distribucija ne u skladu sa normalnim zakonom na nivou značajnosti α.

Kriterijum Lambda Kolmogorov-Smirnova

Dizajnirao Andrey Nikolaevich Kolmogorov I Nikolai Vasilyevich Smirnov.

Statistička hipoteza: Funkcija raspodjele opće populacije (Sl. 2) iz koje se uzima uzorak, odgovara funkciji raspodjele normalnog zakona.

Sl.2. Crvene tačkice - kumulat, izgrađen na osnovu eksperimentalnih podataka, plava krivulja je teorijska funkcija distribucije (normalna distribucija).

Vrijednost kriterija λ F izračunava se formulom:

Zaključak: IF λ F\u003e λ Krit je empirijska distribucija ne odgovara normalno Na nivou značaja α.

Literatura

  1. Viša matematika i matematička statistika: Tutorial za univerzitete / u potpunosti. ed. G. I. Popova. - M. Fizička kultura, 2007.- 368 str.
  2. Osnove matematičke statistike: Tutorial za TOV PIZ. Cult / Ed. V.S. Ivanova. - M.: Fizički odgoj i sport, 1990. 176 str.

Budući da su sve pretpostavke o prirodi određene distribucije hipoteze, a ne kategoričke izjave, tada se prirodno moraju podvrgnuti statističkoj provjeri uz pomoć takozvanih kriterija saglasnosti.

Kriterijumi saglasnosti, zasnovani na utvrđenom zakonu distribucije, omogućuju se uspostavljanjem kada se razlike između teorijskih i empirijskih frekvencija trebaju smatrati beznačajnim (nasumičnim), a kada su značajne (nesumične). Dakle, kriteriji saglasnosti omogućavaju odbiti ili potvrditi ispravnost hipoteze nominirane tijekom poravnanja

o prirodi distribucije u empirijskoj seriji i dati odgovor, moguće je usvojiti za ovu empirijsku distribuciju model izražen nekim teorijskim zakonom distribucije.

Postoji niz kriterija za saglasnost. Češće se koriste kriteriji Pearsona, Romanovskog i Kolmogorova. Razmotrite ih.

Kriterij za saglasnost Pearson% 2 (Chi-kvadrat) jedan je od glavnih kriterija saglasnosti. Kriterij predloži engleski matematičar Karl Pearson (1857-1936) za procjenu slučajeva (materijalnosti) odstupanja između frekvencija empirijskih i teorijskih distribucija. Pearsonov kriterij gdje

broj grupa na kojima se pobijedi empirijska distribucija;

promatrana učestalost znaka u I-Thu grupi; Teorijska frekvencija izračunata na navodnoj distribuciji. Za distribuciju y), sastavljena je tablica u kojoj je kritična vrijednost kriterija saglasnosti naznačena za odabrani nivo značajnosti A i s obzirom na broj stupnjeva slobode V (vidi Dodatak 4).

Razina značaja A je vjerovatnoća pogrešne odstupanja hipoteze koja se proširuje, tj. Vjerojatnost da će se tačna hipoteza biti odbijena. U statističkim studijama, ovisno o važnosti i odgovornosti riješenih zadataka, koriste se sljedeća tri nivoa značaja: 1)

a \u003d 0,10, a zatim p \u003d 0,90; 2)

a \u003d 0,05, zatim p \u003d 0,95; 3)

a \u003d 0,01, a zatim p \u003d 0,99.

Na primjer, vjerojatnost 0,01 znači da u jednom slučaju tačna hipoteza može biti odbijena od 100. U ekonomskim studijama, gotovo prihvatljiva greška smatra se 0,05, tj. U 5 slučajeva, ispravna hipoteza može se odbiti od 100.

Pored toga,% od dva-kriterija definiranog tablicom ovisi o broju stupnjeva slobode. Broj stupnjeva slobode V definiran je kao broj grupa u velikom broju distribucije na minus broja veza sa V

Pod brojem veza znači broj pokazatelja empirijske serije koja se koristi u izračunu teorijskih frekvencija, I.E. Pokazatelji koji povezuju empirijsko i teorijsko / l

učestalost

Dakle, u slučaju usklađivanja na normalnoj krivulji distribucije postoje tri veze:

x ~ x "" su \u003d a "* x sh \u003d y

EMF Theor 'Emp Theore\u003e ^ 1EMP ^ / Theorem *

Stoga, kada je usklađen normalnom distribucijskom krivuljom, broj slobodnih stupnjeva definiran je kao V \u003d k - 3, gdje je k broj grupa u nizu.

U slučaju poravnanja na Poisson krivulja V \u003d k - 2, jer za izgradnju frekvencija koriste se dvije ograničavajuće veze: X, 1TG /

Za procjenu materijalnosti, izračunata vrijednost 2 2 uspoređuje se sa tablicom% 2tabl.

Uz potpunu službu teorijskih i empirijskih distribucija% 2 \u003d 0, u suprotnom% 2\u003e 0.

Ako je Chrnch\u003e Xtable 'T0 na određenom nivou značaja i i broj stupnjeva slobode V hipoteze o gluposti (nasumičnosti) odstupanja.

Ako je% 2ASS ^ x2table 'zaključiti da je empirijska serija dobro u skladu sa hipotezom na predloženoj distribuciji i s vjerojatnošću (1 - a) može se tvrditi da je odstupanje između teorijskih i empirijskih frekvencija nasumično.

Koristeći kriterij saglasnosti? 2, moraju se pridržavati sljedeći uvjeti: 1)

obim ukupnosti u studiju treba biti dovoljno velik (UU\u003e 50), dok frekvencija ili broj svake grupe treba biti najmanje 5.

Ako je ovo stanje slomljeno, potrebno je unaprijed kombinirati male frekvencije; 2)

empirijska distribucija mora se sastojati od podataka dobivenih kao rezultat slučajnog odabira, I.E. Moraju biti neovisni.

Ako u empirijskom redu, distribucija postavlja general / \\ t.

tada y) treba izračunati formulom

Kriterijum Republike Romana Kirgizije zasnovan je na korištenju Purson kriterija% 2, I.E. Već su pronađene vrijednosti% 2, a broj stupnjeva slobode V:

Vrlo je prikladno u nedostatku tablica za% 2.

Ako dr. 3, onda nije slučajno

i u skladu s tim, teorijska distribucija ne može poslužiti kao model za empirijsku distribuciju u studiji.

Kolmogorov X kriterij zasnovan je na utvrđivanju maksimalne razlike između akumuliranih frekvencija ili grupa empirijskih i teorijskih distribucija:

X \u003d -2 \u003d ili x \u003d u

gdje je dud, respektivno, maksimalna razlika između akumuliranih frekvencija (F - F ") i između akumuliranog

grupe (P - R ") empirijskih i teorijskih redova distribucija;

N je broj jedinica u agregatu.

Izračunavanje vrijednosti x, prema tablici P (k) (vidi Dodatak 6) Odredite vjerojatnost s kojom se može tvrditi da je odstupanja empirijskih frekvencija iz teorijskog slučajnog slučaja. Verovatnoća P (k) može varirati od 0 do 1. Kada se pojavi P (k) \u003d 1, frekvencija podudara se, kada je P (k) \u003d 0 - potpuna odstupanja. Ako a, uzima vrijednosti do 0,3, a zatim P (k) \u003d 1.

Osnovno stanje za upotrebu Kolmogorovskog kriterija prilično je veliki broj zapažanja.

Primjer. Pomoću tablice podataka. 5.17, za provjeru ispravnosti hipoteze raspodjele regruta Distrikta po zakonu normalne distribucije. Vrijednosti potrebne za izračunavanje kriterija saglasnosti date su u tablici. 5.19.

Tabela 5.19.

Izračun vrijednosti za utvrđivanje kriterija za pristanak rasta Pearsona X2 i Kolmogorova X, pogledajte frekvenciju više distribucije (/ P - T ") 2 t" FF "KR, \\ TT" A 1 2 3 4 5 6 156-160 8 5 1, 8 8 5 3 161-165 17 16 0,1 25 21 4 166-170 42 40 0,1 67 61 6 171-175 54 65 1,121 126 5 176-180 73 73 0 194 199 5 181- 185 57 57 0 251 256 5 186-190 38 30 2.1 289 286 3 191-195 11 11 0 300 297 3 x 300 297 6.0 Prvo, prvo izračunavamo kriterij

Zatim odaberite nivo značajnosti A \u003d 0,05 i mi određujemo broj stupnjeva slobode V. u ovoj distribuciji 8 grupa, a broj priključaka (parametara) je 3, dakle, V \u003d 8 - 3 \u003d 5. Prema riječima Tabela Dodatka 4, naći ćemo na a \u003d 0, 05 i v \u003d 5 Pearsonov kriterij% 2 \u003d 11.07.

Budući da% 2RC provjerite hipotezu produženo pomoću Romanovskog kriterija:

I X2 - V I 16.0 - 5 I 1

kr \u003d] r \u003d ^ \u003d 1 \u003d - v \u003d 0,3.

Budući da kriterij Romanovskog također potvrđuje da su razlike između empirijskih i teorijskih frekvencija beznačajne.

Sada smatramo primjenu kriterija Kolmogorov a. Kao što se može vidjeti iz tablice. 5.19, maksimalna razlika između kumulativnih frekvencija je 6, i.e. B \u003d Shah! / 1 1- p "\\ \u003d 6. Slijedom toga, Kolmogorov kriterij

X \u003d -? \u003d \u003d \u003d 0,35.

Prema tabeli Dodatka 6, pronalazimo vrijednost verovatnoće na x \u003d 0,35: p (x) \u003d 0,9977. To znači da se s vjerovatnoćom bliskom, može se tvrditi da hipoteza normalne distribucije ne odbije i odstupanja empirijske i teorijske distribucije su slučajne.

Sada potvrđujući ispravnost hipoteze proširena uz pomoć poznatih pristanka kriterija, rezultati raspodjele mogu se koristiti za praktične aktivnosti.

Primjer. Pomoću tablice podataka. 5.18, provjerite hipotezu o podnošenju raspodjele broja grešaka u automobilima po zakonu Poissona.

Početni podaci i izračunavanje vrijednosti potrebnih za utvrđivanje kriterija saglasnosti date su u tablici. 5.20.

Izračunajte vrijednost% 2: 2

DFASCH ^ / 9

(Vidi tablicu 5.20). Hhtor \u003d 9\u003e 49

(Pogledajte Dodatak 4).

Budući da% 2sch tako iznosi hipotezu o raspodjeli broja grešaka u automobilima u skladu sa zakonom Poissona nije odbijena.

Obrada neovisnih mjerenja slučajne varijable ξ, možemo izgraditi statističku funkciju distribucije F * (x). Prema ovoj funkciji, hipotezu možete preuzeti da je prava teorijska funkcija distribucije f (x). Nezavisna mjerenja (x 1, x 2, ..., x n) formiranje uzorka mogu se smatrati jednako raspoređenim nasumičnim varijablama s hipotetičkom funkcijom distribucije F (x).

Očito će doći do nekih odstupanja između funkcija f * (x) i f (x). Postavlja se pitanje - da li su ove razlike zbog ograničenog volumena uzorkovanja ili su povezane sa činjenicom da naša hipoteza nije tačna, I.E. Stvarna funkcija distribucije nije f (x), ali nekih drugih. Da biste riješili ovo pitanje, uživajte u kriterijima saglasnosti, čiji je suština sljedeća. Odabrana je određena vrijednost δ (f, f *) koja karakterizira stupanj razlike između funkcija f * (x) i f (x). Na primjer, Δ (F, F *) \u003d SUP | F (x) -F * (x) |, I.E. Gornje lice x razlike modula.

S obzirom na hipotezu vjernu, i.e. Poznavanje funkcije distribucije F (x), moguće je pronaći zakon distribucije slučajnog varijable Δ (F, F *) (pitanje, kako to učiniti, nećemo se dirati). Postavimo broj p 0 tako mali da će implementacija događaja (Δ (f, f *)\u003e Δ 0) s tom vjerojatnošću smatrati gotovo nemogućom. Od stanja

pronađite vrijednost Δ 0. Ovdje je f (x) gustoća distribucije Δ (f, f *).

Sada se izračunava sada vrijednost Δ (f, f *) \u003d Δ 1 po rezultatima

uzorci, I.E. Pronalazimo jednu od mogućih vrijednosti slučajne varijable δ (F, F *). Ako je Δ 1 ≥Δ 0, onda to znači da se dogodio gotovo nemoguć događaj. To se može objasniti činjenicom da naša hipoteza nije tačna. Dakle, ako je Δ 1 ≥Δ 0, tada se hipoteza odbije, a na Δ 1<Δ 0 , гипотеза может оказаться неверной, но вероятность этого мала.

Kao mjera odstupanja Δ (f, f *), možete poduzeti različite vrijednosti. Ovisno o tome dobivaju se različiti kriteriji saglasnosti. Na primjer, kriterij za pristanak Kolmogorov, Mises, Pearsona ili Chi-kvadratni kriterijumi.

Obavijestite da su rezultati n mjerenja uređeni u obliku grupirane statističke serije sa k diskazama.

Ispuštanje (x 0, x 1) (u stvari pretpostavljamo da se greške u mjerenju ravnomjerno raspoređuju na neki segment). Tada će vjerojatnost udarati svaku od sedam znamenki biti jednaka. Korištenje grupiranog reda od §11, izračunajte δ (f, f *) \u003d Δ 1 \u003d Formulom (1). U ovom slučaju .

Budući da hipotetički zakon o distribuciji uključuje dva nepoznata parametra, α i β - početak i kraj segmenta, broj stupnjeva slobode bit će 7-1-2 \u003d 4. Prema Chi-kvadratnom stolu za distribuciju na verovatnoću verovatnoće P 0 \u003d 10 -3, pronalazimo Δ 0 \u003d 18. Jer Δ 1\u003e Δ 0, tada će hipoteza o jednoličnoj distribuciji mjerne greške mora biti odbačena.

Null (glavni) Oni nazivaju hipotezi izložene u obliku nepoznate distribucije ili na parametre poznatih distribucija. Konkurencija (alternativa) Oni nazivaju hipotezu koja je u suprotnosti s nulom.

Na primjer, ako pretpostavi da nulta hipoteza pretpostavlja da slučajna vrijednost X. Distribuirani zakonom, konkurentna hipoteza može se sastojati u pretpostavci da slučajna vrijednost H. Distribuiran na drugom zakonu.

Statistički kriterij (ili jednostavno) kriteriji) nazovite neki slučajni iznos Dokoji služi za testiranje nulte hipoteze.

Nakon odabira određenog kriterija, na primjer, kriterij, skup svih njegovih mogućih vrijednosti podijeljen je u dva podskupa ne-ciklusa: jedan od njih sadrži vrijednosti kriterija na kojem se odbija nulta hipoteza i Drugi - s kojom je prihvaćen.

Kritična regija Nazovite skup vrijednosti kriterija na kojem se odbija nulta hipoteza. Područje usvajanja hipoteze Nazovite skup vrijednosti kriterija u kojem se uzima hipoteza. Kritične točke Pozivne tačke razdvajaju kritično područje iz područja uzimanja nulte hipoteze.

Za naš primjer vrijednost izračunata uzorka odgovara području usvajanja hipoteze: nasumična varijabla distribuira se zakonom. Ako je izračunata vrijednost, ulazi u kritično područje, odnosno hipoteza o raspodjeli slučajne varijable odbijena je zakonom.

U slučaju distribucije, kritično područje određuje nejednakost, područje uzimanja nulte hipoteze je nejednakost.

2.6.3. Kriterij saglasnosti Pearson.

Jedan od zadataka zootehnia i veterinarske genetike uklanjanje novih pasmina i vrsta sa potrebnim znakovima. Na primjer, poboljšanje imuniteta, otpornost na bolesti ili promjenu boje krznenog poklopca.

U praksi, prilikom analize rezultata često se ispostavi da su stvarni rezultati manje ili više u skladu s nekim teorijskim zakonom o distribuciji. Postoji potreba za procjenom stupnja usklađenosti stvarnih (empirijskih) podataka i teorijskog (hipotetičkog). Da biste to učinili, oni guraju nultu hipotezu: rezultirajuće set distribuira se prema zakonu "A". Provjera hipoteze o navodnom zakonu o distribuciji vrši se pomoću posebno odabrane slučajne varijable - kriterij saglasnosti.

Kriterij saglasnostipotvrditi kriterij za provjeru hipoteze o navodnom zakonu nepoznate distribucije.

Postoji nekoliko kriterija za saglasnost: Pearson, Kolmogorov, Smirnova i D.r. Kriterij Pearsonove saglasnosti najčešće se koristi.

Razmotrite primjenu Pearsonove kriteriju na primjer testa hipoteze o normalnom zakonu distribucije opće populacije. U tu svrhu, usporedit ćemo empirijsku i teorijsku (izračunatu u nastavku normalne distribucije) frekvencije.

Obično postoji neka razlika između teorijskih i empirijskih frekvencija. na primjer:

Empirijske frekvencije 7 15 41 93 113 84 25 13 5

Teorijske frekvencije 5 13 36 89 114 91 29 14 6

Razmotrite dva slučaja:

Odstupanje između teorijskih i empirijskih frekvencija je slučajno (beznačajno), i.e. Moguće je napraviti prijedlog za distribuciju empirijskih frekvencija prema normalnom zakonu;

Odstupanje između teorijskih i empirijskih frekvencija nije slučajnost (značajno), i.e. Teorijske frekvencije izračunavaju se na osnovu pogrešne hipoteze o normalnoj distribuciji opće populacije.

Uz pomoć kriterija, saglasnost Pearsona može se odrediti slučajno ili bez razlike između teorijskih i empirijskih frekvencija, I.E. Sa datom verovatnoćom poverenja, distribuira se opštim agregatu prema normalnom zakonu ili ne.

Dakle, ako je uzorak volumena N dobiven empirijska distribucija:

Opcije ......

Empirijske frekvencije .......

Pretpostavimo da se teorijske frekvencije izračunavaju u predviđenoj distribuciji. Na nivou značaja, potrebno je provjeriti nulti hipotezu: opća populacija se obično distribuira.

Kao kriterij za provjeru nulte hipoteze, uzet ćemo slučajni iznos

(*)

Ova vrijednost je nasumična, jer u različitim eksperimentima potrebno je razne, unaprijed nepoznate vrijednosti. Jasno je da su manje empirijske i teorijske frekvencije, manje vrijednosti kriterija i stoga, u određenoj mjeri karakterizira blizinu empirijskih i teorijskih distribucija.

Dokazano je da sa zakonom distribucije slučajnog varijable (*), bez obzira na to kako zakon distribucije podliježe općoj populaciji, nastoji zakon distribucije sa stupnjevima slobode. Stoga se nasumična vrijednost (*) označava, a sam kriterij naziva kriterij saglasnosti "Chi-Trga".

Označite vrijednost kriterija izračunatog prema promatračkim podacima, putem. Označene su kritične vrijednosti kriterija za ovaj nivo od značaja i broj stupnjeva slobode. U ovom slučaju, broj stupnjeva slobode utvrđuje se iz ravnopravnosti, gdje je broj grupa (djelomični intervali) uzorkovanja ili nastave; - Broj parametara navodne distribucije. U normalnoj distribuciji, dva parametra - matematičko očekivanje i sekundarno kvadratno odstupanje. Zbog toga se broj stupnjeva slobode za normalnu distribuciju nalazi iz ravnopravnosti

Ako se nejednakost vrši za izračunatu vrijednost i vrijednost tablice Nulta hipoteza preuzima se na normalnu raspodjelu opće populacije. Ako Nulta hipoteza odbija i uzima alternativu hipotezi (opći agregat se ne distribuira u skladu sa normalnim zakonom).

Komentar. Kada koristite krivični kriterij Pearsona, jačina uzorka mora biti najmanje 30. Svaka grupa mora sadržavati najmanje 5 opcija. Ako u grupama ima manje od 5 frekvencija, kombiniraju se sa susjednim grupama.

U opštem slučaju, broj stupnjeva slobode za distribuciju Chi-Kvadrata definiran je kao ukupan broj vrijednosti za koje odgovarajući pokazatelji izračunavaju, minus broj tih uvjeta koji vezuju ove vrijednosti, tj. Smanjite mogućnost varijacije između njih. U najjednostavnijim slučajevima, pri izračunavanju broja stupnjeva slobode bit će jednak broju klasa smanjenih za jedan. Na primjer, u dihijbridu, cijepanje, 4, ali ne samo se ne samo prva klasa već je već povezana s prethodnim. Stoga za dihibrid cijepanje, broj stupnjeva slobode.

Primjer 1. Odredite stupanj usklađenosti stvarne raspodjele grupa po broju pacijenata sa tuberkulozom krava sa teoretski očekivanim, koji je izračunat kada se razmatra uobičajeno raspodjelo. Izvorni podaci smanjuju se na tablicu:

Odluka.

U pogledu značaja i broja stupnjeva slobode od tabele kritičnih distributivnih tačaka (vidi Dodatak 4) Pronalazimo vrijednost . Ukoliko , Može se zaključiti da je razlika između teorijskih i stvarnih frekvencija nasumična. Stoga, stvarna raspodjela grupa u broju pacijenata sa kravama tuberkuloze odgovara teoretski očekivanoj.

Primer 2. Teorijska distribucija kroz fenotip pojedinaca dobivenih u drugoj generaciji u dihijbridnom prelasku zečeva prema Mendelovom zakonu je 9: 3: 3: 1. Potrebno je izračunati prepisku empirijskog raspodjele zečeva sa prelaska crnih pojedinca Normalna vuna sa umiranjem životinja - Albinos. Prilikom prelaska u drugoj generaciji dobiveno je 120 potomka, uključujući 45 crna sa kratkom vunom, 30 crna, 25 bijela sa kratkom vunom, 20 bijelih zečeva.

Odluka. Teoretski, očekivano dijeljenje u potomstvu trebalo bi odgovarati omjeru četiri fenotipa (9: 3: 3: 1). Izračunajte teorijske frekvencije (broj glava) za svaku klasu:

9 + 3 + 3 + 1 \u003d 16, tako da možete očekivati \u200b\u200bda crnu skraće ; crno obojen - ; Bijela kratkodlaka - ; Bijeli padovi -.

Empirijska (stvarna) distribucija fenotipa bila je sljedeća 45; Trideset; 25; dvadeset.

Sve ove podatke ćemo smanjiti na sljedeću tablicu:

Korištenjem kriterija Pearsonove saglasnosti izračunava se:

Broj stupnjeva slobode sa dihibridnim prelazom. Za značaj Pronaći važnost . Ukoliko , Može se zaključiti da je razlika između teorijskih i stvarnih frekvencija nesuvremeno. Slijedom toga, rezultirajuća skupina zečeva odstupa u raspodjelu fenotipa iz Zakona o Mendelu dihijbridnom prelaskom i odražava učinak određenih faktora koji mijenjaju vrstu cijepanja duž fenotipa u drugoj generaciji prepreka.

Kriterij za saglasnost Pearson Chi-Trga može se koristiti za usporedbu međusobnim dvo homogenim empirijskim distribucijama, I.E. Takve su iste granice časova. Hipoteza jednakosti dvije nepoznate funkcije distribucije uzima se kao nulta hipoteza. Chi-kvadratni kriterij u takvim slučajevima određuje formulu

(**)

gdje i su količine upoređenih distribucija; i - frekvencije odgovarajućih klasa.

Razmotrite usporedbu dva empirijska distribucija na sljedećem primjeru.

Primjer 3. Procjena se vršila dužina jaja kukavice na dvije teritorijalne zone. U prvoj zoni je ispitan uzorak od 76 jaja (), u drugom od 54 (). Dobivaju se sljedeći rezultati:

Dužina (mm)
Učestalost
Učestalost - - -

Na nivou značaja, potrebno je provjeriti nulti hipotezu da oba uzorka jaja pripadaju jednoj populaciji kukavice.

Slični članci

2021 ROOKame.ru. Građevinski portal.