logo

Statistikada variatsiyani baholash usullariva dispersion tahlil asoslari

Yuklangan vaqt:

20.02.2024

Ko'chirishlar soni:

0

Hajmi:

608.7509765625 KB
 “ STATISTIKA ” FANIDAN STATISTIKADA VARIATSIYANI BAHOLASH USULLARIVA DISPERSION TAHLIL ASOSLARI MAVZUSIDA TAYYORLANGAN TAQDIMOT  REJA: 1. Variatsiya to’g’risida tushuncha. 2. Variatsiyaning miqdoriy o’lchovlari 3. Standart chetlanishni talqin qilish      Statistikaning muhim vazifalaridan biri faqatgina umumlashtiruvchi ko’rsatkichlarni (o’rtachalarni) hisoblash bilan cheklanmasdan, balki to’plam birliklarining o’rtachadan tafovutini, farqini, chetlanishini ham o’rganishdir. Bu ishni statistika variatsiya ko’rsatkichlari yordamida bajaradi. “ Variatsiya ” so’zi lotincha “variatio” so’zidan kelib chiqqan bo’lib, o’zgarish, farq, tebranishni bildiradi. Statistikada variatsiya deganda, o’zaro qarama-qarshi omillar ta’sirida bo’lgan, bir turli birlikdan tashkil topgan miqdoriy o’zgarishlarga tushuniladi. O’rganilayotgan belgining tasodifiy va surunkali (sistematik) variatsiyalari bo’lishi mumkin. 1. Variatsiya to’g’risida tushuncha  Tasodifiy variatsiyani boshqarib bo’lmaydi. Surunkali variatsiyaga qisman bo’lsada, ta’sir o’tkazish mumkin. Variatsion kenglik (R) deganda belgining eng katta va kichik hadlari orasidagi farq (tafovut) tushuniladi va u quyidagicha aniqlanadi:   R=X max -X min   bu erda: R- variatsion kenglik; X max - belgining eng katta darajasi; X min – belgining eng kichik darajasi. O’rtacha chiziqli chetlanish variantalar bilan o’rtacha farqining variantalar soniga nisbatidir. Oddiy qatorlar uchun u quyidagi formula bilan hisoblanadi: Tortilgan qatorlar uchun u quyidagi formula bilan hisoblanadi:n x x d    f f x x d     O’rtacha kvadrat chetlanish yoki dispersiya deb variantlar bilan o’rtachani farqi kvadratlari yig’indisining variantlar soni nisbatiga aytiladi. Oddiy qatorlar uchun Tortilgan qatorlar uchun2  n х х 2 2 ) (     f f х х     2 2 ) (  O’rtacha kvadratik chetlanish deb o’rtacha kvadrat chetlanishning kvadrat ildizdan chiqarilgan miqdoriga aytiladi va quyidagi formulalar bilan aniqlanadi: Oddiy qatorlar uchun Tortilgan qatorlar uchun  n х х 2 ) (     f f х х     2 ) (  Variatsiya koeffitsienti (V) deganda, o’rtacha kvadratik tafovutning o’rtacha miqdorga nisbati tushuniladi. Bu ko’rsatkich foizda ifodalanadi va quyidagi formula bilan aniqlanadi:100   x V  Quydagi jadval ma’lumotlari asosida variatsiya ko’rsatkichlarini hisoblaymiz. Ish normasini bajarganlar bo’yicha guruhlar, % Sotuvchilar soni, (f) Intervalning o’rtacha qiymati, x xf 90-100 28 95 2660 -10 100 2800 100-110 48 105 5040 0 - - 110-120 20 115 2300 +10 100 2000 120-130 4 125 500 +20 400 1600 Jami 100 - 10500 - 6400 Birinchi navbatda o’rtacha norma bajarilishini aniqlaymiz: Dispersiyani aniqlaymiz. o’rtacha kvadratik chetlanish teng: Variatsiya koeffitsientini hisoblaymiz:% 105 100 10500 4 20 48 28 50 2300 5040 2660 4 20 48 28 4 125 20 115 48 105 28 95                        f хf х 64 100 6400 ) ( 2 2       f f х х  8 64 100 6400 ) ( 2        f f х х  % 62, 7 105 100 8 100      x V  9 .2 Variatsiyaning miqdoriy o’lchovlari * To’plam variatsiyasini baholovchi eng sodda miqdoriy o’lchovlardan biri – bu variatsion kenglikdir. Miqdoriy ma’lumotlar qatorining variatsion kengligi – eng katta o’lchov bilan eng kichik o’lchov ayirmasiga teng. Variatsion kenglikni hisoblash va tushunish oson, lekin ma’lumotlar qatori juda katta bo’lganda u ma’lumotlar variatsiyasini o’lchashda ma’nosizdir. Buning sababi, ikkita m’lumotlar qatori b ir xil variatsion kenglikka ega bo’lgan holda ma’lumotlar variatsiyasi tufayli juda ham katta tafovutga ega bo’lishi mumkin. 2.19 - rasmda tasvirlangan fenomen quyidagicha: rasmda ko’rsatilgan har ikki taqsimot qatorlari bir xil vaiiatsion kenglikka ega, lek in biz allaqachon bildikki, B dori vositasi bo’yicha javob vaqtlari A dori vositasiga nisbatan kamroq tarqoqlikka ega. Demak, ko’rishiniz mumkinki, variatsion kenglik har doim ham katta ma’lumotlar qatorlari uchun ma’lumotlar variatsiyasidagi farqlarni ani qlay olmaydi. *Manba : Lames McClave, Terry Sincich. Statistics. 12 th edition. Pearson Education, Inc. 2013. 61 -64 pp.   Keling, variatsion kenglikdan ko’ra ma’noliroq bo’lgan ma’lumotlar variatsiyasi ko’rsatkichini aniqlay olishimiz yoki yo’qligini ko’rib chiqamiz. 2.5 - jadvaldagi ikkita tanlama to’plamni ko’z oldingizga keltiring: har birida 5 tadan ko’rsatki ch mavjud. (Qulaylik uchun biz raqamlarni tartibladik.) E’tibor bersangiz har ikkala to’plam ham 3 ga teng o’rtachaga ega, biz har bir ko’rsatkich va o’rtacha orasidagi masofa yo’nalishni, yoki chetlanishni hisobladik. 1 -jadval Ikki nazariy ma’lumotlar qatori 1-to’plam 2-to’plam O’lchovlar 1, 2, 3, 4, 5 2, 3, 3, 3, 4 O’rtacha miqdor ��ഥ = �� + �� + �� + �� + �� �� = ���� �� = �� ��ഥ = �� + �� + �� + �� + �� �� = ���� �� = �� x dan o’lchovlar qiymatining chetlanishi (1 -3), (2 -3), (3 -3), (4 -3), (5 -3) yoki -2, -1, 0, 1, 2 (2 -3), (3 -3), (3 -3), (3 -3), (4 -3) yoki -1, 0, 0 ,0 , 1 a. 1 -to’plam b. 2 -to’plam 2-rasm. 1-jadvaldagi chetlanishlaruchun nuqtali diagramma Ushbu chetlanishlar qanday ma’lumotlarni o’z ichiga oladi? Agar ularning o’lchamlari 1 -to’plamdagi kabi juda ham katta bo’lsa, ma’lumotlar juda tarqoq va variatsiya yuqori bo’ladi. Agar chetlanish 2 -to’plamdagi kabi sezilarli kichik bo’lsa, ma’lumotlar o’rtacha atrofida to’planadi va shuning uchun ham katt a variatsiyani namoyish qilmaydi. Siz ko’rishingiz mumkinki, 2 -rasmda tasvirlangan chetlanishlar tanlama to’plam ko’rsatkichlarining variatsiyasi to’g’risidagi ma’lumotlarni beradi. Keyingi qadam bu – ushbu oraliqdagi ma’lumotlarni variatsiyaning yagona so nli o’lchoviga keltirishdir. x bo’yicha chetlanishlarning o’rtachasini topish yordam bermaydi, chunki manfiy va musbat chetlanishlar biri birini yo’qotadi va shuning uchun chetlanishlarning yig’indisi (demak o’rtacha chetlanish) ha m doim nolga teng bo’ladi. Manfiy va musbat chetlanishlar biri birini yo’qotadi degan faktni muhokama qilishda ikkita usul hayolga keladi. Birinchisi, hamma chetlanishlarni musbat sifatida qabul qilish, ikkinchisi, manfiy qiymatlarning ishorasini baratara f etish. Biz ushbu fikrlarni qabul qila olmaymiz, sababi variatsiyaning natijaviy ko’rsatkichi (chetlanishlar absolyut qiymatlarining o’rtachasi) keyinchalik qiyinchiliklar tug’dirishi mumkin. Ikkinchi chetlanishlarning manfiy ishoralarini bartaraf qilish metodi ularni kvadratga ko’tarishdir. Kvadratga ko’tarilgan chetlanishlardan biz hisoblashimiz mumkin bo’lgan miqdor ma’lumotlar qatori variatsiyasining ancha ma’noliroq tasvirini kafolatlaydi va xulosalar qilishda kamroq analitik qiyinchiliklarni tug’dira di. Ma’lumotlar qatorida hisoblangan kvadratik chetlanishlardan foydalanish uchun, biz dastlab tanlama to’plam dispersiyasini hisoblaymiz.  n o’lchamli tanlama to’plam uchun tanlama to’plam dispersiyasi o’rtachadan chetlanishlar kvadrati yig’indisining ( n - 1) ga nisbatiga teng. Tanlama to’plam dispersiyasi ifodalash uchun s2belgisidan foydalaniladi. Tanlama to’plam dispersiyasi uchun formula :  2 2 1 1 n i i x x s n      E’tibor bering :s2hisoblash uchun qisqa formula: 2 2 1 2 1 1 n i n i i i x x n s n             1 -jadvaldagi ikkita to’plamga nazar tashlab, siz 1 -tanlama to’plam uchun dispersiyani quyidagicha hisoblashingiz mumkin : 1 -jadvaldagi ikkita to’plamga nazar tashlab, siz 1 -tanlama to’plam uchun dispersiyani quyidagicha hisoblashingiz mumkin : 2 2 2 2 2 2 (1 3) (2 3) (3 3) (4 3) (5 3) 5 1 4 1 0 1 4 2.5 4 s                   Ma’lumotlar variatsiyasining ma’noga ega o’lchovini topishdagi ikkinchi qadam – bu ma’lumotlar qatorining standart chetlanishini hisoblashdir. Tanlama to’plamning standart chetlanishi ,s, tanlama to’plam dispersiyasi s2ning musbat ildizi sifatida aniqlanadi yoki matematik jihatdan , 2 s s σ 2 (sigma kvadrat) belgisi bilan belgilanadigan bosh to’plam dispersiyasi to’plamdagi barcha birliklarning o’rtacha, µ dan kvadrat chetlanishlarining o’rtachasidir va σ (sigma) esa ushbu miqdorning kvadrat ildizidir.  Dispersiya va standart chetlanish uchun belgilar s2= Tanlama to’plam dispersiyasi s= Tanlama to’plam standart chetlanishi σ 2= Bosh to’plam dispersiyasi σ = Bosh to’plam standart chetlanishi E’tibor bersangiz, dispersiyadan farqli ravishda, standart chetlanish - ko’rsatkichlarning haqiqiy birligida ifodalanadi . Masalan, agar haqiqiy ko’rsatkichlar dollarda bo’lsa, dispersiya mahsus birliklar “dollar kvadratlarda” ifodalanadi, lekin standart chetlanish dollarlarda ifodalanadi . Biz tanlama to’plam dispersiyasini hisoblashda nima uchun n ning o ’rniga (n - 1) bo’luvchidan foydalanishimizni bilishga qiziqayotgan bo’lishingiz mumkin.Tanlama to’plam dispersiyasi o’rtachadan kvadratik o’rtacha oraliq bo’lishi uchun n dan foydalanish mantiqiyroq emasmi ? Muammo shundaki, n dan foydalanish bosh to’plam disp ersiyasi σ 2 ning kattaroq qiymat qabul qilishiga olib kelishi mumkin.Shuning uchun ushbu holatni to’g’rilash maqsadida maxrajda (n - 1) dan foydalanamiz *.s2 kabi tanlama to’plam ko’rsatkichlari bosh to’plamning σ 2 kabi parmetrlarini boshlang’ich baholashda qo’llanilgani sababli, tanlama to’plam dispersiyasini aniqlashda n dan ko’ra ( n - 1) foydalanish afzalroq hisoblanadi. *Bu erda s2 ning (n -1) bo’luvchi bilan hisoblanishi , σ 2 ning siljimagan bahosi hisoblanadi .   s2 ni hisoblashda necha o’nli kasrgacha yaxlitlanishi kerak ? Bu borada yaxlitlash to’g’risida aniq qoida bo’lmaganligi sabali , zarur bo’ladigan natijadan ikki barobar ko’p darajagacha yaxlitlash zarur . Masalan , siz s ning aniqlik darajasi yuzdan birgacha yaxlitlikda chiqishini istasangiz , s 2 natijasi mingdan bir darajagacha (to’rt xonagacha ) yaxlitlash zarur .  9 .3. Standart chetlanishni talqin qilish* Biz ko’rib o’tdikki, agar bosh to’plamdan tanlab olingan ikkita to’plamning variatsiyalashuv darajasini taqqoslayotgan bo’lsak, kattaroq standart chetlanishga ega to’plam ko’proq variatsiyaga ega bo’ladi. Demak, biz nisbiy va qiyosiy asosda standart chetlanishni qanday tushintirishni bilamiz, ammo biz hali uning bitta to’plam variatsiyasini qanday ifodalashini tushintirmadik. Standart chetlanish ma’lumotlar qatorini ng variatsiya ko’rsatkichini qanday ifodalashini tushinish uchun quyidagi savollarni hayoldan o’tkazamiz: o’rtachaning bitta standart chetlanishi orasida nechta ko’rsatkich mavjud? Ikkita standart chetlanish orasida nechta ko’rsatkich mavjud? Muayyan ma’lu motlar qatori uchun biz bu savollarga har bir intervaldagi ko’rsatkichlar sonini sanash orqali javob berishimiz mumkin. Biroq, har qanday ma’lumotlar qatoriga, ya’ni bosh to’plam yoki tanlama to’plamga taalluqli savollarga javob topish ancha mushkul. 2 va 3 -jadvallar o’rtachaning bir, ikki yoki uchta standart chetlanishi orasiga nechta ko’rsatkich tushishi to’g’risidagi savollarga ikkita javobni taqdim etadi. Birinchisi, har qanday ma’lumotlar qatoriga taalluqli bo’lib, rus matematigi P.L.Chebishev (1821 – 18 94) tomonidan isbotlangan nazariyadan kelib chiqadi. Ikkinchisi esa, qo’rg’on shaklli, simmetrik taqsimot qatorlariga (ularda o’rtacha, mediana va moda deyarli bir xil bo’ladi) tegishli bo’lib, yillar davomida to’plangan empirik dalillarga asoslangan. Biro q, 3 -jadvaldagi intervallar uchun berilgan foizlar hatto taqsimot qatorlari biroz og’ishgan yoki assimetrik bo’lgan holda ham anchagina yaxshi tahminiy xulosalar berish imkonini beradi. E’tibor berish kerakki, ushbu qoidalar yoki bosh to’plamga yoki tanla ma to’plamga nisbatan qo’llaniladi. Tarjimai xol Pafnutiy L.Chebishev (1821 -1894) Ajoyib rus matematigi P.L.Chebishev Moskva universitetining matematika sohasida o’qigan, keyinchalik magistrlik darajasini olgan. O’qishni tugatgach, Chebishev Sank -Peterburg universitetining (Rossiya) professor safiga qo’shiladi va mashhur “Peterburg matematika maktabining” namoyondasiga aylanadi. U shu erda o’rtachaning standart chetlanishlari orasida joylashgan ko’rsatkichlarning ehtimolligi haqidagi o’zining mashhur nazariyasini isbotladi. (2.6 -jadval). Uning frantsuz tilini mukammal bilishi, ehtimollar nazariyasi sohasida xalqaro darajada tan olinishiga imkon berdi. Umuman olganda, Chebishev o’zining “butun dunyo matematigi” ekanligini aytib, “ajoyib rus mate matigi” sifatida tanilishini maqsad qilgandi. Talabalardan biri Chebishevni “ajoyib ma’ruzachi” sifatida ta’riflaydi, “dars uchun juda mas’uliyatli. Qo’ng’iroq chalinishi bilan u darxol bo’rni tashlab, oqsoqlab auditoriyani tark etardi” deb eslaydi  2-jadval . Standart chetlanishni talqish qilish: Chebishev qoidasi Chebishev qoidasi taqsimot qatorlarining shaklidan qat’iy nazar har qanday ma’lumotlar qatoriga tadbiq qilinadi. a. Shunday bo’lishi mumkinki, o’rtachaning bitta standart chetlanishi oralig’iga judayam oz ko’rsatkichlar tushishi mumkin [ya’ni, tanlama to’plam uchun    ,  s x s x   interval oralig’i va bosh to’plam uchun    ,  s s     oraliq]. b. Ko’rsatkichlarning eng kamida 3/4 qismi o’rtachaning ikkita standart chetlanishi orasida yotadi [ya’ni, tanlama to’plam uchun      2 2 , x s x s   interval oralig’i va bosh to’plam uchun      2 2 ,s s     oraliq]. c. Ko’rsatkichlarning eng kamida 8/9 qismi o’rtachaning uchta standart chetlanishi orasida yotadi [ya’ni, tanlama to’plam uchun      3 3 , x s x s   interval oralig’i va bosh to’plam uchun      3 3 ,s s     oraliq]. d. Umuman olganda, 1 dan katta bo’lgan har qanday k soni uchun, eng kamida ko’rsatkichlarning (1 – 1/ k2) tasi o’rtachaning k ta standart chetlanishi oralig’iga tushadi [ya’ni, tanlama to’plam uchun     , k x ks x s   interval oralig’i va bosh to’plam uchun     , k s s k     oraliq]. 3 -jadval. Standart chetlanishni talqish qilish: empirik qoida Empirik qoida – bu boshlang’ich qoida bo’lib, chastotalari taqsimoti qo’rg’on shakldagi yoki simmetrik bo’lgan ma’lumotlar qatori uchun qo’llaniladi: a. Ko’rsatkichlarning taxminan 68% o’rtachaning bitta standart chetlanishi orasida joylashadi [ya’ni, tanlama to’plam uchun    ,  s x s x   interval oralig’i va bosh to’plam uchun    ,  s s     oraliq]. b. Ko’rsatkichlarning taxminan 95% o’rtachaning ikkita standart chetlanishi orasida yotadi [ya’ni, tanlama to’plam uchun      2 2 , x s x s   interval oralig’i va bosh to’plam uchun      2 2 ,s s     oraliq]. c. Ko’rsatkichlarning taxminan 99.7% (deyarli hammasi) o’rtachaning uchta standart chetlanishi orasida yotadi [ya’ni, tanlama to’plam uchun      3 3 , x s x s   interval oralig’i va      3 3 ,s s     bosh to’plam uchun oraliq  E’TIBORINGIZ UCHUN RAHMAT !!!