مفهوم معیارهای رضایت. معیار رضایت ملاک رضایت است

هنگام تجزیه و تحلیل سری تغییرات از توزیع ، از اهمیت زیادی برخوردار است توزیع تجربی ویژگی مطابقت دارد طبیعی... برای این منظور ، فرکانسهای توزیع واقعی باید با فرکانسهای نظری که مشخصه توزیع طبیعی هستند مقایسه شود. این بدان معنی است که محاسبه فرکانسهای نظری منحنی توزیع نرمال از داده های واقعی ، که تابعی از انحرافات نرمال شده است ، ضروری است.

به عبارت دیگر ، منحنی توزیع تجربی باید با منحنی توزیع نرمال هماهنگ شود.

توصیف عینی انطباق نظری و تجربی فرکانس ها می توان با استفاده از شاخص های آماری ویژه به آنها دست یافت معیارهای رضایت.

ملاک رضایت معیاری نامیده می شود که به شما اجازه می دهد اختلاف را تشخیص دهید تجربی و نظری توزیع ها تصادفی هستند یا قابل توجه ، یعنی اینکه آیا داده های مشاهده با فرضیه آماری مطرح شده موافق هستند یا موافق نیستند. توزیع جمعیت عمومی را که به دلیل فرضیه مطرح شده دارد ، نظری می نامند.

ایجاد ضروری می شود ملاک (یک قاعده) که به شما اجازه می دهد قضاوت کند که آیا اختلاف بین توزیع های تجربی و نظری تصادفی است یا قابل توجه. در صورت عدم وجود اختلاف تصادفی، سپس در نظر بگیرید که داده های مشاهده (نمونه) با فرضیه ارائه شده در مورد قانون توزیع جمعیت عمومی سازگار است و بنابراین ، فرضیه پذیرفته می شود. در صورت عدم وجود اختلاف قابل توجه، سپس داده های مشاهده با این فرضیه موافق نیستند و آن را رد می کنند.

معمولاً فرکانسهای تجربی و نظری با این تفاوت که:

  • این اختلاف تصادفی است و با تعداد محدودی مشاهدات همراه است.
  • این اختلاف تصادفی نیست و با این واقعیت توضیح داده می شود که فرضیه آماری مبنی بر توزیع عادی جمعیت عمومی غلط است.

به این ترتیب معیارهای رضایت اجازه رد یا تأیید درست بودن فرضیه مربوط به ماهیت توزیع در مجموعه های تجربی ارائه شده هنگام تراز کردن مجموعه ها را می دهد.

فرکانسهای تجربی در نتیجه مشاهده به دست آمده است. فرکانس های نظری محاسبه شده توسط فرمول ها.

برای قانون توزیع عادی آنها را می توان به شرح زیر یافت:

  • Σƒ من - مجموع فرکانسهای تجربی انباشته (تجمعی)
  • h - تفاوت بین دو گزینه مجاور
  • σ - نمونه انحراف استاندارد
  • t - انحراف نرمال (استاندارد)
  • φ (t) تابع چگالی احتمال توزیع نرمال است (برای مقدار مربوطه t پیدا شده است)

چندین معیار خوب بودن وجود دارد که رایج ترین آنها عبارتند از: آزمون مجذور کای (پیرسون) ، آزمون کلموگروف ، آزمون رومانوفسکی.

آزمون برازش مناسب پیرسون χ 2 - یکی از اصلی ترین ها ، که می تواند به عنوان مجموع نسبت های اختلاف مربع بین فرکانس های نظری (f T) و تجربی (f) به فرکانس های نظری نشان داده شود:

  • k تعداد گروههایی است که توزیع تجربی به آنها تقسیم می شود ،
  • f i - فرکانس مشاهده شده صفت در گروه I ،
  • f T - فرکانس نظری.

برای توزیع χ 2 ، جداول وارد می شوند ، جایی که مقدار حیاتی ملاک توافق χ 2 برای سطح معناداری α و درجه آزادی df (یا ν) نشان داده شده است.
سطح معناداری α احتمال رد اشتباه فرضیه پیشنهادی است ، به عنوان مثال احتمال رد شدن یک فرضیه صحیح. R - روایی آماری پذیرش فرضیه صحیح. در آمار ، سه سطح اهمیت اغلب استفاده می شود:

α \u003d 0.10 ، سپس P \u003d 0.90 (در 10 مورد از 100)

α \u003d 0.05 ، سپس P \u003d 0.95 (در 5 مورد از 100)

α \u003d 0.01 ، سپس Р \u003d 0.99 (در 1 مورد از 100 مورد) می توان فرضیه صحیح را رد کرد

تعداد درجات آزادی df به عنوان تعداد گروههای مجموعه توزیع منهای تعداد پیوندها تعریف می شود: df \u003d k –z. تعداد اتصالات به عنوان تعداد شاخص های سری تجربی مورد استفاده در محاسبه فرکانس های نظری قابل درک است ، به عنوان مثال شاخصهایی که فرکانسهای تجربی و نظری را بهم پیوند می دهند.به عنوان مثال ، هنگامی که با یک منحنی زنگ هماهنگ می شود ، سه رابطه وجود دارد.بنابراین ، هنگام هم ترازی بامنحنی زنگ تعداد درجه آزادی به عنوان df \u003d k - 3 تعریف می شود.برای ارزیابی ماده ، مقدار محاسبه شده با جدول χ مقایسه می شود 2 زبانه

با همزمانی کامل توزیع های نظری و تجربی χ 2 \u003d 0 ، در غیر این صورت χ 2\u003e 0 اگر χ 2 calc\u003e χ 2 برگه است ، سپس برای سطح مشخصی از اهمیت و تعداد درجات آزادی ، ما این فرضیه را که بی تفاوت هستند (تصادفی) رد می کنیم.اگر χ 2 محاسبه شود< χ 2 табл то ما این فرضیه را می پذیریم و با احتمال Р \u003d (1-α) می توان ادعا کرد که اختلاف بین فرکانسهای نظری و تجربی تصادفی است. بنابراین ، دلیل وجود این باور وجود دارد که توزیع تجربی مطیع است توزیع نرمال. اگر میزان جمعیت به اندازه کافی بزرگ باشد (N\u003e 50) از آزمون برازش پیرسون استفاده می شود ، در حالی که فراوانی هر گروه باید حداقل 5 باشد.

بر اساس تعیین حداکثر اختلاف بین فرکانسهای تجربی و نظری انباشته شده:

جایی که D و d به ترتیب بیشترین اختلاف بین فرکانسهای انباشته شده و فرکانسهای انباشته توزیعهای تجربی و نظری است.
با توجه به جدول توزیع آمار کلموگروف ، این احتمال تعیین می شود که می تواند از 0 تا 1 متغیر باشد. هنگامی که P (λ) \u003d 1 ، یک توافق کامل از فرکانس ها وجود دارد ، P (λ) \u003d 0 - یک واگرایی کامل. اگر مقدار احتمال P در رابطه با مقدار یافته شده λ قابل توجه باشد ، در این صورت می توان فرض کرد که اختلاف بین توزیع های نظری و تجربی ناچیز است ، یعنی ماهیت تصادفی دارند.
شرط اصلی استفاده از معیار کلموگروف تعداد کافی مشاهدات است.

آزمون خوب بودن کلموگروف

بگذارید نحوه درخواست ملاک کلموگروف (λ) را بررسی کنیم آزمایش فرضیه توزیع طبیعی جمعیت عمومی.همسان سازی توزیع واقعی با منحنی زنگ شامل چندین مرحله است:

  1. فرکانس های واقعی و نظری را مقایسه کنید.
  2. داده های واقعی فرکانس های نظری منحنی توزیع نرمال را تعیین می کنند ، که تابعی از انحراف نرمال است.
  3. بررسی کنید که توزیع مشخصه چقدر با ویژگی طبیعی مطابقت دارد.

برایچهارمستون جدول:

در MS Excel ، انحراف نرمال (t) با استفاده از تابع نرمال سازی محاسبه می شود. لازم است با تعداد گزینه ها (ردیف های صفحه گسترده) طیف وسیعی از سلول های آزاد را انتخاب کنید. بدون حذف انتخاب ، با عملکرد نرمال سازی تماس بگیرید. در کادر گفتگویی که ظاهر می شود ، سلولهای زیر را که به ترتیب مقادیر مشاهده شده (X i) ، میانگین (X) و انحراف معیار which در آن قرار دارند ، مشخص کنید. عملیات باید تمام شود همزمان با فشار دادن Ctrl + Shift + Enter

برایVستون جدول:

تابع چگالی احتمال توزیع نرمال φ (t) از جدول مقادیر تابع محلی لاپلاس برای مقدار متناظر انحراف نرمال (t) یافت می شود

برایششمستون جدول:

معیار خوب بودن تناسب ، آزمون معناداری است که برای آزمون فرضیه قانون توزیع جمعیت عمومی که از آن نمونه گرفته شده ، استفاده می شود.

در اکثر مواقع ، محقق علاقه مند است که آیا توزیع داده های تجربی مطابق با قانون عادی است؟ بنابراین ، مثالها مربوط به بررسی توزیع آزمایشی از نظر نرمال بودن خواهد بود.

  • معیار شاپیرو-ویلکی
  • آزمون Chi-Square
  • معیار لامبدا Kolmogorov-Smirnov

ضابطه SHAPIRO-WILKIE

شرایط کاربرد: اندازه نمونه کوچک

H 0 - توزیع جمعیت عمومی که نمونه جمعیت از آن بدست می آید مطابق با قانون عادی است.

H 1 - توزیع جمعیت عمومی که نمونه جمعیتی از آن بدست آمده با قانون عادی مطابقت ندارد.

جدول 1 - الگوریتم محاسبه معیار Shapiro-Wilk.

ایکسایکسΔkکمچ پاankΔk
1 2 3 4 5 6 7
1 11,8 13,8 2 1 0,5739 1,1478
2 12 13,2 1,2 2 0,3291 0,39492
3 12,1 13 0,9 3 0,2141 0,19269
4 12,3 12,8 0,5 4 0,1224 0,0612
5 12,6 12,6 0 5 0,0399 0
6 12,6 12,6
7 12,8 12,3 جمع \u003d b \u003d 17966
8 13 12,1
9 13,2 12
10 13,8 11,8

روش محاسبه معیار Shapiro-Wilk

  1. ما فرضیه H 0 را در مورد مطابقت توزیع جمعیت عمومی ، که از آن داده ها به قانون عادی بدست آمده ، فرموله می کنیم. ما سطح معنی داری α \u003d 0.05 را تعیین می کنیم.
  2. ما نمونه ای از داده های آزمایشی (ستون 1 جدول 1) را دریافت می کنیم. در مورد ما ، n \u003d 10.
  3. ما مقدار واریانس نمونه را محاسبه می کنیم. به عنوان مثال ، S 2 \u003d 0 ، 37.
  4. نمونه را به ترتیب صعودی و نزولی رتبه بندی می کنیم (ستون های 2 و 3)
  5. ما اختلافات Δk (ستون 5) را محاسبه می کنیم
  6. از جدول 6 ضمیمه (نگاه کنید به V.S Ivanov ، 1990) مقادیر ضرایب ank (ستون 6) را پیدا می کنیم
  7. محصول ankΔk را پیدا کنید
  8. b \u003d مجموع ankΔk \u003d 1.7966 را محاسبه کنید
  9. ما مقدار معیار Wf را طبق فرمول محاسبه می کنیم:
  1. از روی میز 7 ضمیمه (نگاه کنید به V.S Ivanov ، 1990) ما مقدار بحرانی معیار Shapiro-Wilk را برای α \u003d 0.05 Wcrit \u003d 0.842 \u003d پیدا می کنیم.
  2. نتیجه. از آنجا که Wf\u003e Wcrit ، می توان گفت که داده های آزمایشی مطابق با قانون عادی در سطح معناداری 0.05 است.

معیار CHI-SQUARE

طراحی شده توسط کارل پیرسون... این بر اساس ساخت یک سری تغییرات فاصله ای و مقایسه فرکانس های تجربی (n em) و نظری (n t) است (شکل 1).

عکس. 1. هیستوگرام مشخصه توزیع تجربی و تابع چگالی احتمال توزیع نرمال.

فرضیه آماری: تراکم توزیع جمعیت عمومی که از آن نمونه گرفته شده مربوط به مدل نظری توزیع طبیعی است.

مقدار آزمون مجذور کای واقعی با استفاده از فرمول محاسبه می شود:

اگر مقدار واقعی آزمون مجذور كای بزرگتر یا برابر با مقدار بحرانی آزمون مجذور كای باشد ، می توان نتیجه گرفت كه توزیع تجربی در سطح معنی داری α با قانون طبیعی مطابقت ندارد.

معیار LAMBDA KOLMOGOROV-SMIRNOV

توسعه یافته توسط آندری نیکولایویچ کلموگوروف و نیکولای واسیلیویچ اسمیرنوف.

فرضیه آماری: عملکرد توزیع جمعیت عمومی (شکل 2) ، که نمونه از آن گرفته شده است ، با عملکرد توزیع قانون عادی مطابقت دارد.

شکل 2 نقاط قرمز - تجمعی ، ساخته شده بر اساس داده های تجربی ، منحنی آبی - عملکرد توزیع نظری (توزیع نرمال).

مقدار معیار λ f با فرمول محاسبه می شود:

نتیجه گیری: اگر λ f\u003e λ crit - توزیع تجربی با حالت عادی مطابقت ندارد در سطح معنی داری α.

ادبیات

  1. ریاضیات بالاتر و آمار ریاضی: یک کتاب درسی برای دانشگاه ها / ویرایش. ویرایش شده G.I. پوپوف - M. فرهنگ جسمی ، 2007. - 368 ص.
  2. مبانی آمار ریاضی: کتاب درسی برای فیزیکی. فرقه / اد. در مقابل. ایوانوا - م.: فرهنگ بدنی و ورزش ، 1990. 176 ص.

از آنجا که تمام فرضیات در مورد ماهیت یک توزیع خاص فرضیه هستند و گزاره های طبقه ای نیستند ، مطمئناً باید با استفاده از آزمون های به اصطلاح برازش ، تحت آزمایش آماری قرار بگیرند.

معیارهای برازش ، براساس قانون توزیع شده تعیین شده ، امکان ایجاد اختلاف زمانی بین فرکانسهای نظری و تجربی را ناچیز (تصادفی) و چه زمانی - قابل توجه (غیر تصادفی) فراهم می کند. بنابراین ، معیارهای خوب بودن تناسب امکان رد یا تأیید صحت فرضیه ارائه شده هنگام تراز کردن مجموعه را دارد.

در مورد ماهیت توزیع در مجموعه های تجربی و پاسخ دهید که آیا می توان برای توزیع تجربی معین مدلی را که توسط برخی از قانون های توزیع نظری بیان شده است ، پذیرفت.

تعدادی معیار برای رضایت وجود دارد. غالباً از معیارهای پیرسون ، رومانوفسکی و کلموگروف استفاده می شود. بیایید آنها را در نظر بگیریم.

آزمون میزان برازش پیرسون٪ 2 (مجذور کای) یکی از اصلی ترین آزمونهای برازش است. این معیار توسط ریاضی دان انگلیسی کارل پیرسون (1857-1936) برای ارزیابی تصادفی بودن (معنی دار بودن) اختلاف بین فرکانس های توزیع های تجربی و نظری ارائه شده است. معیار پیرسون که در آن k

تعداد گروههایی که توزیع تجربی به آنها تقسیم می شود.

فرکانس مشاهده شده از ویژگی در گروه i؛ فرکانس نظری محاسبه شده از توزیع فرض. برای توزیع y) ، جداول جمع آوری می شوند ، که نشان دهنده مقدار حیاتی معیار خوب بودن تناسب٪ 2 برای سطح معنی داری انتخاب شده و تعداد مشخصی از درجه آزادی V است (به پیوست 4 مراجعه کنید)

سطح معنی داری a احتمال رد اشتباه فرضیه پیشنهادی است ، به عنوان مثال احتمال رد شدن یک فرضیه صحیح. در مطالعات آماری ، بسته به اهمیت و مسئولیت وظایف حل شده ، از سه سطح اهمیت زیر استفاده می شود: 1)

a \u003d 0.10 ، سپس P \u003d 0.90 ؛ 2)

a \u003d 0.05 ، سپس P \u003d 0.95 ؛ 3)

a \u003d 0.01 ، سپس P \u003d 0.99.

به عنوان مثال ، احتمال 01/0 به این معنی است که می توان فرضیه صحیح را در یک مورد از 100 رد کرد. در تحقیقات اقتصادی ، احتمال خطای 0.05 عملاً قابل قبول تلقی می شود ، یعنی در 5 مورد از 100 مورد ، می توان فرضیه صحیح را رد کرد.

علاوه بر این ، معیار٪ 2 تعیین شده از جدول نیز به تعداد درجه آزادی بستگی دارد. تعداد درجات آزادی V به عنوان تعداد گروههای سری توزیع k منهای تعداد پیوندهای با V تعریف می شود

تعداد اتصالات به عنوان تعداد شاخص های سری تجربی مورد استفاده در محاسبه فرکانس های نظری قابل درک است ، به عنوان مثال شاخص های تجربی و نظری

فرکانس ها

بنابراین ، در صورت هم ترازی با منحنی توزیع نرمال ، سه رابطه وجود دارد:

x ~ x "" SU \u003d a "* x W \u003d Y

تئور EMF 'EMF TheOr\u003e ^ 1EMP ^ / تئوری *

بنابراین ، هنگام ترازبندی در امتداد منحنی توزیع نرمال ، تعداد درجه آزادی به عنوان V \u003d k - 3 تعیین می شود ، جایی که k تعداد گروههای ردیف است.

در صورت هم ترازی در امتداد منحنی پواسون ، V \u003d k - 2 ، زیرا از دو محدودیت محدود کننده در ساخت فرکانس ها استفاده می شود: x ، 1tr /

برای ارزیابی اهمیت ، مقدار محاسبه شده٪ 2 محاسبه شده با جدول 2٪ جدول مقایسه می شود.

اگر توزیع های نظری و تجربی کاملاً منطبق باشد ،٪ 2 \u003d 0 ، در غیر این صورت٪ 2\u003e 0.

اگر Xcalc\u003e Xtabl 'T0 برای سطح معینی از اهمیت a و تعداد درجات آزادی V ، فرضیه ناچیز بودن اختلافات (تصادفی) را رد می کنیم.

اگر٪ 2acc ^ X2tabL 'نتیجه بگیریم که این سری تجربی با فرضیه توزیع فرضیه مطابقت دارد و با احتمال (1 - الف) می توان ادعا کرد که اختلاف بین فرکانسهای نظری و تجربی تصادفی است.

با استفاده از معیار موافقت؟ 2 ، شرایط زیر باید رعایت شود: 1)

حجم جمعیت مورد مطالعه باید به اندازه کافی بزرگ باشد (UU\u003e 50) ، در حالی که فرکانس یا اندازه هر گروه باید حداقل 5 باشد.

اگر این شرط نقض شود ، لازم است ابتدا فرکانس های کوچک را ترکیب کنید. 2)

توزیع تجربی باید از داده های به دست آمده از انتخاب تصادفی تشکیل شود ، به عنوان مثال آنها باید مستقل باشند.

اگر در سری های تجربی توزیع توسط فرکانس ها / \\ m داده شود.

سپس y) باید با فرمول محاسبه شود

معیار رومانوفسکی Kp براساس معیار پیرسون٪ 2 ، یعنی مقادیر٪ 2 و تعداد درجه آزادی v را قبلاً پیدا کرده اید:

وقتی جداولی برای٪ 2 وجود ندارد بسیار مفید است.

اگر Kr 3 باشد ، تصادفی نیست

و بر این اساس ، توزیع نظری نمی تواند به عنوان الگویی برای توزیع تجربی مورد مطالعه باشد.

معیار کلموگوروف X بر اساس تعیین حداکثر اختلاف بین فرکانسهای تجمع یافته یا فرکانسهای توزیع تجربی و نظری است:

X \u003d -2 \u003d یا X \u003d ، iN

جایی که Dud حداکثر اختلاف بین فرکانسهای انباشته شده (F - F ") و بین انباشته است

فرکانسهای nym (p - p ") مجموعه تجربی و نظری توزیع ها ؛

N تعداد واحدهای موجود در کل است.

با محاسبه مقدار X ، مطابق جدول P (k) (به پیوست 6 مراجعه کنید) ، این احتمال تعیین می شود که می توان ادعا کرد انحراف فرکانسهای تجربی از فرضهای نظری تصادفی هستند. احتمال P (k) می تواند از 0 تا 1 باشد. وقتی P (k) \u003d 1 یک توافق کامل از فرکانس ها وجود دارد ، وقتی P (k) \u003d 0 - یک واگرایی کامل. اگر A ، مقادیر تا 0.3 را بگیرد ، P (k) \u003d 1.

شرط اصلی استفاده از معیار کلموگروف تعداد کافی مشاهدات است.

مثال. با استفاده از داده های موجود در جدول. 5.17 ، برای بررسی صحت فرضیه ارائه شده در مورد توزیع نیروهای جدید در منطقه مطابق با قانون توزیع طبیعی. مقادیر لازم برای محاسبه معیارهای برازش در جدول آورده شده است. 5.19

جدول 5.19

محاسبه مقادیر برای تعیین معیارهای توافق Pearson x2 و Kolmogorov X Height، cm فرکانس های سری توزیع (/ n - t ") 2 تن" FF "cr ، \\ t" A 1 2 3 4 5 6 156-160 8 5 1 ، 8 8 5 3 161-165 17 16 0.1 25 21 4 166-170 42 40 0.1 67 61 6 171-175 54 65 1.9 121 126 5 176-180 73 73 0 194 199 5 181-185 57 57 0 251 256 5 186-190 38 30 2.1 289 286 3 191-195 11 11 0 300 297 3 X 300 297 6.0 ابتدا معیار پیرسون را محاسبه کنید

سپس سطح معنی داری a \u003d 0.05 را انتخاب می کنیم و تعداد درجه آزادی V را تعیین می کنیم. در این توزیع 8 گروه وجود دارد و تعداد پیوندها (پارامترها) 3 است ، بنابراین ، V \u003d 8 - 3 \u003d 5. مطابق جدول پیوست 4 ، ما برای a \u003d 0 ، 05 و V \u003d 5 آزمون پیرسون٪ 2 \u003d 11.07.

از آنجا که٪ 2 محاسبه شده است اجازه دهید فرضیه ارائه شده را با استفاده از آزمون رومانوفسکی بررسی کنیم:

I X2 - V I 16.0 - 5 I 1

cr \u003d] G \u003d ^ \u003d 1 \u003d --r \u003d 0.3.

از آنجا که معیار Cr Romanovsky نیز تأیید می کند که اختلاف بین فرکانسهای تجربی و نظری ناچیز است.

حال اجازه دهید استفاده از معیار Kolmogorov A را بررسی کنیم. همانطور که از جدول می بینید. 5.19 ، حداکثر اختلاف بین فرکانسهای تجمعی 6 است ، یعنی B \u003d شاه! / 1 - P "\\ \u003d 6. بنابراین ، معیار کلموگروف

X \u003d -؟ \u003d \u003d \u003d 0.35.

مطابق جدول پیوست 6 ، مقدار احتمال را در X \u003d 0.35 پیدا می کنیم: P (X) \u003d 0.9997. این بدان معناست که با احتمال نزدیک به وحدت می توان ادعا کرد که فرضیه توزیع طبیعی رد نمی شود و اختلاف بین توزیع های تجربی و نظری تصادفی است.

حال ، با تأیید صحت فرضیه ارائه شده با استفاده از معیارهای شناخته شده خوب بودن تناسب ، می توانیم از نتایج توزیع برای فعالیت های عملی استفاده کنیم.

مثال. با استفاده از داده های موجود در جدول. 5.18 ، فرضیه مربوط به تابع توزیع تعداد خطاها در اتومبیل ها را به قانون پواسون آزمایش کنید.

داده های اولیه و محاسبه مقادیر لازم برای تعیین معیارهای برازش در جدول آورده شده است. 5.20

بیایید مقدار٪ 2: 2 را محاسبه کنیم

Dfasch ^ / 9

(جدول 5.20 را ببینید). xXtabl \u003d 9\u003e 49

(به پیوست 4 مراجعه کنید).

از آنجا که٪ 2 محاسبه شده بنابراین ، فرضیه توزیع تعداد خطاها در اتومبیل ها مطابق قانون پواسون رد نمی شود.

با پردازش اندازه گیری های مستقل یک متغیر تصادفی ξ ، می توان یک تابع توزیع آماری F * (x) ساخت. با فرم این تابع ، می توان این فرضیه را پذیرفت که تابع توزیع نظری واقعی F (x) است. اندازه گیری های مستقل (x 1 ، x 2 ، ... ، x n) که نمونه را تشکیل می دهند را می توان متغیرهای تصادفی توزیع شده یکسان با عملکرد توزیع فرضی F (x) دانست.

بدیهی است که بین توابع F * (x) و F (x) اختلافاتی وجود داشته باشد. این س arال مطرح می شود - آیا این اختلافات نتیجه محدود بودن حجم نمونه است یا به این واقعیت مربوط می شود که فرضیه ما درست نیست ، یعنی تابع توزیع واقعی F (x) نیست ، بلکه برخی دیگر است. برای حل این مسئله ، از معیارهای رضایت استفاده کنید که اصل آنها به شرح زیر است. یک مقدار مشخص Δ (F ، F *) انتخاب می شود ، که مشخصه درجه اختلاف بین توابع F * (x) و F (x) است. به عنوان مثال ، Δ (F ، F *) \u003d Sup | F (x) -F * (x) | ، به عنوان مثال حد بالا در x از مدول تفاوت.

درست دانستن فرضیه ، یعنی با دانستن تابع توزیع F (x) ، می توانیم قانون توزیع متغیر تصادفی Δ (F ، F *) را پیدا کنیم (ما در مورد چگونگی انجام این کار صحبت نمی کنیم). بگذارید عدد p 0 را آنقدر کوچک قرار دهیم که واقعه (Δ (F، F *)\u003e Δ 0) با این احتمال عملاً غیرممکن تلقی شود. از شرط

مقدار Δ 0 را پیدا کنید. در اینجا f (x) چگالی توزیع Δ (F ، F *) است.

اکنون مقدار Δ (F، F *) \u003d Δ 1 را طبق نتایج محاسبه می کنیم

نمونه گیری ، یعنی یکی از مقادیر ممکن متغیر تصادفی Δ (F ، F *) را پیدا کنید. اگر Δ 1 ≥ Δ 0 ، پس این بدان معنی است که یک اتفاق تقریباً غیرممکن رخ داده است. این را می توان با این واقعیت توضیح داد که فرضیه ما درست نیست. بنابراین ، اگر Δ 1 ≥ Δ 0 ، فرضیه رد می شود ، و برای Δ 1<Δ 0 , гипотеза может оказаться неверной, но вероятность этого мала.

مقادیر مختلف را می توان به عنوان اندازه گیری اختلاف Δ (F ، F *) در نظر گرفت. بسته به این ، معیارهای مختلف توافق حاصل می شود. به عنوان مثال ، آزمون برازش كلموگروف ، میزس ، پیرسون یا آزمون مجذور كای.

اجازه دهید نتایج n اندازه گیری در قالب یک سری آماری گروه بندی شده با k رقم ارائه شود.

تخلیه (x 0 ، x 1) (در واقع ، ما فرض می کنیم که خطاهای اندازه گیری به طور یکنواخت در برخی از بخش ها توزیع شده اند). سپس احتمال برخورد به هر یک از هفت رقم خواهد بود. با استفاده از سری گروه بندی شده از §11 ، Δ (F ، F *) \u003d Δ 1 \u003d را با فرمول (1) محاسبه می کنیم. در این مورد .

از آنجا که قانون توزیع فرضی شامل دو پارامتر ناشناخته است ، α و β آغاز و انتهای بخش هستند ، تعداد درجات آزادی 7-1-2 \u003d 4 خواهد بود. با توجه به جدول توزیع مربع خی با احتمال انتخاب شده p 0 \u003d 10 -3 ، Δ 0 \u003d 18 را پیدا می کنیم. زیرا Δ 1\u003e Δ 0 ، پس فرضیه توزیع یکنواخت خطای اندازه گیری باید کنار گذاشته شود.

خالی (اصلی) فرضیه ای است که در مورد شکل توزیع ناشناخته یا پارامترهای توزیع شناخته شده مطرح شده است. در حال رقابت (جایگزین) فرضیه ای مغایر با صفر نامیده می شود.

به عنوان مثال ، اگر فرضیه صفر در فرض متغیر تصادفی باشد ایکس طبق قانون توزیع می شود ، پس فرضیه رقابت ممکن است در فرض متغیر تصادفی باشد ایکس طبق قانون دیگری توزیع شده است.

معیار آماری (یا به سادگی ملاک) برخی از متغیرهای تصادفی را فراخوانی کنید به، که در خدمت آزمایش فرضیه صفر است.

پس از انتخاب یک معیار خاص ، به عنوان مثال ، یک معیار ، مجموعه تمام مقادیر ممکن آن به دو زیرمجموعه جداگانه تقسیم می شود: یکی از آنها حاوی مقادیر معیاری است که فرض صفر برای آن رد می شود و دیگری که برای آن پذیرفته شده است.

منطقه حیاتی مجموعه مقادیری است که در آن فرضیه صفر رد می شود. حوزه پذیرش فرضیه مجموعه مقادیر معیار فراخوانی می شود که در آن فرضیه پذیرفته می شود. نقاط بحرانی نقاطی هستند که منطقه بحرانی را از منطقه پذیرش فرضیه صفر جدا می کنند.

برای مثال ما ، هنگامی که مقدار ، مقدار محاسبه شده از نمونه با منطقه پذیرش فرضیه مطابقت دارد: متغیر تصادفی طبق قانون توزیع می شود. اگر مقدار محاسبه شده ، در ناحیه بحرانی قرار می گیرد ، یعنی فرضیه توزیع متغیر تصادفی مطابق قانون رد می شود.

در صورت توزیع ، ناحیه بحرانی با نابرابری و منطقه پذیرش فرضیه صفر با نابرابری تعیین می شود.

2.6.3. ملاک رضایت پیرسون.

یکی از وظایف zootechnics و ژنتیک دامپزشکی توسعه نژادها و گونه های جدید با مشخصات مورد نیاز است. به عنوان مثال ، افزایش ایمنی ، مقاومت در برابر بیماری یا تغییر رنگ پوست.

در عمل ، هنگام تجزیه و تحلیل نتایج ، اغلب معلوم می شود که نتایج واقعی به میزان کم و بیش مطابق با برخی از قوانین توزیع نظری است. نیاز به ارزیابی میزان مطابقت بین داده های واقعی (تجربی) و نظری (فرضی) است. برای انجام این کار ، یک فرضیه صفر مطرح کنید: جمعیت حاصل طبق قانون "A" توزیع می شود. فرضیه مربوط به قانون توزیع مفروض با استفاده از یک متغیر تصادفی خاص انتخاب شده است - آزمون خوب بودن تناسب.

ملاک رضایتمعیار آزمایش فرضیه مربوط به قانون فرض توزیع ناشناخته نامیده می شود.

معیارهای مختلفی برای توافق وجود دارد: پیرسون ، کلموگروف ، اسمیرنوف و غیره آزمون برازش پیرسون بیشترین استفاده را دارد.

اجازه دهید استفاده از معیار پیرسون را در نمونه آزمایش فرضیه توزیع طبیعی جمعیت عمومی بررسی کنیم. برای این منظور ، ما فرکانسهای تجربی و نظری (محاسبه شده در ادامه توزیع نرمال) را مقایسه خواهیم کرد.

معمولاً بین فرکانسهای نظری و تجربی تفاوتهایی وجود دارد. مثلا:

فرکانسهای تجربی 7 15 41 93 113 84 25 13 5

فرکانس های نظری 5 13 36 89 114 91 29 14 6

دو مورد را در نظر بگیرید:

اختلاف بین فرکانسهای نظری و تجربی تصادفی (ناچیز) است ، یعنی شما می توانید مطابق قانون معمول ، توزیع فرکانسهای تجربی را ارائه دهید.

اختلاف بین فرکانسهای نظری و تجربی تصادفی نیست (قابل توجه) ، به عنوان مثال فرکانس های نظری بر اساس فرضیه نادرست توزیع طبیعی جمعیت عمومی محاسبه می شود.

با استفاده از معیار مناسب بودن پیرسون ، می توان به طور تصادفی اختلاف بین فرکانسهای نظری و تجربی را تعیین کرد ، یعنی با یک سطح اطمینان مشخص ، تعیین کنید که آیا جمعیت عمومی طبق قانون عادی توزیع شده است یا خیر.

بنابراین ، اجازه دهید یک توزیع تجربی برای نمونه ای از اندازه n بدست آید:

گزینه ها ……

فرکانسهای تجربی.

بگذارید فرض کنیم فرکانسهای نظری با فرض توزیع نرمال محاسبه می شوند. در سطح معنی داری ، لازم است فرضیه صفر آزمایش شود: جمعیت عمومی به طور معمول توزیع می شود.

به عنوان یک ملاک برای آزمایش فرضیه صفر ، ما یک متغیر تصادفی را در نظر می گیریم

(*)

این مقدار تصادفی است ، زیرا در آزمایش های مختلف مقادیر مختلف و قبلاً ناشناخته به خود می گیرد. واضح است که هرچه فرکانسهای تجربی و نظری اختلاف کمتری داشته باشند ، مقدار معیار کمتر است و بنابراین ، تا حدودی ، ویژگی نزدیکی توزیعهای تجربی و نظری است.

ثابت شده است که در ، قانون توزیع یک متغیر تصادفی (*) ، صرف نظر از قانون توزیع عمومی که مردم عمومی تحت آن هستند ، به یک قانون توزیع با درجه آزادی تمایل دارد. بنابراین ، متغیر تصادفی (*) با نشان داده می شود و خود معیار را آزمون خوب بودن "مربع خی" می نامند.

بگذارید مقدار معیار محاسبه شده از داده های مشاهده از طریق مقادیر بحرانی جدول بندی شده از معیار برای سطح معینی از اهمیت و تعداد درجات آزادی تعیین شده است. در این حالت ، تعداد درجات آزادی از برابری تعیین می شود ، جایی که تعداد گروهها (فواصل جزئی) از نمونه یا کلاسها ؛ - تعداد پارامترهای توزیع فرض شده. توزیع طبیعی دارای دو پارامتر است - انتظار ریاضی و انحراف معیار. بنابراین ، تعداد درجات آزادی برای توزیع طبیعی از برابری حاصل می شود

اگر مقدار محاسبه شده و مقدار جدول نابرابری را برآورده کنند ، فرضیه صفر توزیع طبیعی جمعیت عمومی پذیرفته می شود. اگر ، فرضیه صفر رد می شود و یک فرضیه جایگزین پذیرفته می شود (جمعیت عمومی طبق قانون عادی توزیع نمی شود).

اظهار نظر. هنگام استفاده از آزمون برازش پیرسون ، اندازه نمونه باید حداقل 30 باشد. هر گروه باید حداقل 5 گزینه داشته باشد. اگر در گروهها کمتر از 5 فرکانس وجود داشته باشد ، آنها با گروههای همسایه ترکیب می شوند.

در حالت کلی ، تعداد درجات آزادی برای توزیع مجذور کای به عنوان تعداد کلی مقادیر استفاده شده برای محاسبه شاخص های متناظر ، منهای تعداد شرایطی که این مقادیر را بهم متصل می کنند ، تعریف می شود ، به عنوان مثال امکان تغییر بین آنها را کاهش می دهد. در ساده ترین موارد ، هنگام محاسبه ، تعداد درجه آزادی برابر با تعداد طبقات کاهش یافته توسط یک برابر خواهد بود. بنابراین ، به عنوان مثال ، با برش دی هیبریدی ، 4 کلاس بدست می آید ، اما فقط کلاس اول غیر مرتبط به دست می آید ، دسته های بعدی قبلاً با کلاسهای قبلی متصل شده اند. بنابراین ، برای تقسیم دیبریدی ، تعداد درجات آزادی.

مثال 1 میزان مطابقت توزیع واقعی گروهها را بر اساس تعداد گاوهای مبتلا به سل با نظریه مورد انتظار تعیین کنید ، که در هنگام توزیع طبیعی محاسبه می شود. داده های اولیه در جدول خلاصه شده است:

تصمیم گیری

با توجه به سطح معنی داری و تعداد درجه آزادی از جدول نقاط مهم توزیع (به پیوست 4 مراجعه کنید) ، مقدار را پیدا می کنیم ... از آنجا که ، می توان نتیجه گرفت که تفاوت بین فرکانسهای نظری و واقعی تصادفی است. بنابراین ، توزیع واقعی گروه ها با توجه به تعداد گاوهای مبتلا به سل با نظریه مورد انتظار مطابقت دارد.

مثال 2 توزیع نظری فنوتیپ افراد به دست آمده در نسل دوم از طریق عبور هیبریدی خرگوش ها بر اساس قانون مندل 9: 3: 3: 1 است. لازم است محاسبه مطابقت توزیع تجربی خرگوش ها از عبور افراد سیاه پوست با پشم طبیعی با حیوانات پائین - آلبینوس. هنگامی که در نسل دوم صلیب شد ، 120 فرزند به دست آمد ، از جمله 45 سیاه پوست با موهای کوتاه ، 30 سیاه پوستان ، 25 سفید با موهای کوتاه ، 20 خرگوش داونی سفید.

تصمیم گیری تقسیم نظری انتظار می رود در فرزندان باید با نسبت چهار فنوتیپ مطابقت داشته باشد (9: 3: 3: 1). بیایید فرکانسهای نظری (تعداد سرها) را برای هر کلاس محاسبه کنیم:

9 + 3 + 3 + 1 \u003d 16 ، بنابراین می توانید کوتاه موهای سیاه را انتظار داشته باشید ؛ داونی سیاه - ؛ سفید کوتاه - ؛ داونی سفید -.

توزیع فنوتیپ تجربی (واقعی) به شرح زیر 45 بود. سی 25؛ بیست.

بیایید همه این داده ها را در جدول زیر خلاصه کنیم:

با استفاده از آزمون برازش پیرسون ، مقدار را محاسبه می کنیم:

تعداد درجات آزادی در یک گذرگاه هیبریدی. برای سطح معنی داری پیدا کردن ارزش ... از آنجا که ، می توان نتیجه گرفت که تفاوت بین فرکانسهای نظری و واقعی اتفاقی نیست. در نتیجه ، گروه خرگوشهای حاصل از توزیع فنوتیپها از قانون مندل هنگام عبور از دیبرید منحرف می شود و تأثیر برخی از عواملی را تغییر می دهد که نوع تقسیم فنوتیپ را در نسل دوم هیبریدها تغییر می دهند.

از آزمون جاذبه خی پیرسون نیز می توان برای مقایسه دو توزیع تجربی همگن با یکدیگر استفاده کرد ، یعنی آنهایی که مرزهای طبقاتی یکسانی دارند. فرضیه برابری دو تابع توزیع ناشناخته به عنوان فرضیه صفر پذیرفته می شود. معیار مربع خی در چنین مواردی توسط فرمول تعیین می شود

(**)

حجم توزیع های مقایسه شده کجاست و و - فرکانسهای کلاسهای مربوطه.

مقایسه دو توزیع تجربی را در مثال زیر در نظر بگیرید.

مثال 3 طول تخم های فاخته در دو منطقه سرزمینی اندازه گیری شد. در منطقه اول ، یک نمونه از 76 تخم () ، در دوم ، از 54 () مورد بررسی قرار گرفت. نتایج زیر بدست آمده اند:

طول (میلی متر)
فرکانس ها
فرکانس ها - - -

در سطح معناداری ، لازم است این فرضیه صفر آزمایش شود که هر دو نمونه تخم مرغ به یک جمعیت فاخته تعلق دارند.

مقالات مشابه

2020 rookame.ru. پورتال ساختمانی.