Таңдаманың статистикалық таралуы.
Алынған таңдамалық зерттеулерді жүйелендіруде таралудың статистикалық дискретті және интервалды қатарлар қолданылады.
Вариациялық қатар - сәйкес жиіліктерімен бірге ранжирленген ретпен орналасқан белгінің сандық мәндері.
Вариациялық қатардың негізгі белгіленулері:
- варианта, зерттеліп отырған белгінің сандық өрнектелуі;
- вариантаның жиілігі (“салмақ”), оның вариациялық қатарда қайталану саны;
n - бақылаудың жалпы саны, таңдама көлемі (яғни, барлық жиіліктердің қосындысы, n=Σ );
- вариациялық қатарды шектейтін шеткі варианталар, (қатардың лимиттері);
- қатардың амплитудасы (яғни, ең жоғарғы және ең төменгі варианталардың айырымы ).
Таңдаманың сандық сипаттамалары
Вариациялық қатарлар мен таңдама деректерінің графиктік кескінделулері таңдама жиынтықтағы белгінің қалай түрленетіні жөнінде көрнекі түрде ақпарат бере алады. Бірақ олар таңдаманы толық сипаттау үшін жеткіліксіз, бұл мақсатта жалпылайтын сандық сипаттамаларды қолдану керек.
Таңдаманың сандық сипаттамалары бақылау деректері жөнінде сандық мәлімет береді және оларды өзара салыстыруға мүмкіндік береді. Практикалық маңызы ең жоғары сандық сипаттамаларға таңдама таралулардың орын (таңдама таралудың ортасының орнын анықтайды) және шашырау сипаттамалары жатады. Орын сипаттамаларына таңдама орта, медиана және мода жатады.
Вариациялық қатардың қолданылуы:
Вариациялық қатар орта шаманы ( ) және әртүрлілік критерийлерін ( )анықтау үшін қолданылады.
Орта шама – зерттеліп отырған белгі өлшемінің жалпылама сипаттамасы. Ол бір санмен сапалы біртекті жиынтықты сандық сипаттауға мүмкіндік береді.
Бас жиынтықтан таңдама алынсын, және х1-n1 рет, х2-n2 рет, ..., хk-nk рет қайталанады, ал -таңдама көлемі. х1 мәндерін варианталар деп, ал өсу ретімен жазылған варианталар тізбегін вариациялық қатар деп атайды. Қарастырылатын мәндер санын жиіліктер, ал олардың таңдама көлеміне қатынасын салыстырмалы жиіліктер - деп айтады.
Таңдаманың статистикалық таралуы деп варианталар мен оларға сәйкес жиіліктер немесе салыстырмалы жиіліктердің тізімі аталады.
Медиана(Ме) вариациялық қатарды тең екіге бөлетін мән, одан төмен және одан жоғары мәндердің бірдей саны орналасады және медианаға дейін одан кіші мәндердің 50% - ы, одан кейін үлкен мәндердің 50% -ы жатады.
Егер бақылаулар саны n тақ болса , онда медиананы есептеу жеңіл. Бұл вариациялық қатардағы – ші нөмірлі варианта болады. Мысалы, егер n=11 болса, онда медиана вариациялық қатардағы 6–шы нөмірлі варианта болады. Егер n жұп болса, онда медиана вариациялық қатардағы - ші және – ші нөмірлі варианталардың арифметикалық ортасы болады. Мысалы, егер n= 20 болса, онда медиана = 10- шы және + 1=11- нөмірлі варианталардың арифметикалық ортасы болады.
Егер деректердің таралуы симметриялы болса, онда медиана орта мәнге ұқсас, егер деректердің таралуы оң жаққа қарай қисайған асимметриялы болса, онда орта мәннен кіші, егер деректердің таралуы сол жаққа қарай қисайған асимметриялы болса, онда медиана орта мәннен үлкен.
Мода (moda, mo)
Мода (Мо) – деректер жиынында ең жиі кездесетін мән, егер деректер үздіксіз болса, онда оларды топтастырып модальды топты анықтайды. Кейбір деректер жиынында мода болмайды, себебі әрбір мән тек бір рет кездеседі. Кейде модалар бірнешеу болуы мүмкін, ол біртекті емес жиынтықтарда кездеседі. Мода жалпылайтын сипаттама ретінде өте сирек қолданылады.
Бас орта
бас орта деп бас жиынтық белгісінің орта арифметикалық мәнін айтады.
Егер N көлемді бас жиынтық белгісінің барлық х1,......хN мәндері әртүрлі болса, онда
Егер x1, x2,….xк белгісінің мәндері сәйкесінше N1, N2, …….Nk жиіліктерге ие болса, мұнда N1+ N2+....+.Nk=N
;
Таңдама орта
Х сандық белгісіне қатысты бас жиынтықты зерттеу үшін n көлемді таңдама алынсын.
таңдама орта деп таңдама жиынтық белгісінің орта арифметикалық мәнін айтады.
Егер n көлемді таңдаманың барлық x1, x2,….xn мәндері әр түрлі болса, онда
Егер таңдаманың x1, x2,….xк мәндерінің сәйкесінше жиіліктері n1, n2,……..nk болса, және n1+n2+…..+nk=n онда , немесе
Көлемі n – ге тең Х сандық белгінің мәндер жиынтығын қарастырамыз.
мұнда .
Шашырау сипаттамалары
Орта мәндер өзгермелі белгілер жөнінде толық ақпарат бермейді. Мәселен, екі таңдаманың таралуларының орта мәндері бірдей болулары мүмкін, бірақ олардың біреуінде белгілердің мәндері орта мәннің айналасына жақын орналасуы, ал екіншісінде алыс орналасулары мүмкін. Сондықтан орта мәндермен қатар таңдаманың шашырау сипаттамаларын да есептейді.
Шашырау көрсеткіштеріне таңдаманың дисперсиясы, стандарттық ауытқу, таңдаманың құлашы, процентильдер(квартильдер),вариация коэффициенті, квартильаралық құлаш жатады.
Бас дисперсия
Бас жиынтықтың Х сандық белгісі мәндерінің өз орта мәнінің маңайында шашырауын сипаттау үшін бас дисперсия сипаттамасы енгізіледі.
бас дисперсиясы деп бас жиынтық белгісі мәндерінің орта мәнінен ауытқуының квадратының орта арифметикалық мәнін айтады.
Егер N көлемді бас жиынтық белгісінің барлық х1, х2 ,.., хN мәндері әртүрлі болса, онда
Егер белгінің барлық х1, х2 ,.., хк мәндерінің сәйкес жиіліктері N1, N2, …, Nk бар болса, және N1+N2+ +…+Nk=N, онда ;
Бас жиынтықтың сандық белгісі мәндерінің өз орта мәнінің маңайында шашырауын сипаттау үшін дисперсиядан басқа Стандарттық ауытқуды пайдаланады.
Бас орташа квадраттық ауытқу деп бас дисперсиядан алынған квадрат түбірді айтады: .
Таңдама дисперсия S2 деп белгінің бақыланатын мәндерінің орта мәнінен ауытқу квадраттарының орта арифметикалық мәнін айтады.
Егер n көлемді таңдаманың барлық x1, x2,….xn белгілерінің мәндері әр түрлі болса, онда
Егер x1, x2,….xn мәндерінің жиіліктері бар және сәйкесінше n1, n2, …, nk болса, мұндағы
n1+ n2+ …+ nk=n, онда .
Теорема: Дисперсия таңдама мәндерінің квадраттарының орта мәні мен орта мәнінің квадратының айырымына тең: .
Стандарттық ауытқу ( standart deviation, SD )
Стандарттық ауытқу(орта квадраттық ауытқу) деректер мәндерінің түрленгіштігін бейнелейді және оны деректер жиынының өзгергіштігін айқындау үшін қолданады. Стандарттық ауытқу – дисперсиядан алынған оң түбір.
Бұл көрсеткіш неғұрлым үлкен болса, өлшенген айнымалының шашырауы соғұрлым үлкен. Стандарттық ауытқулардың өлшем бірлігі таңдама ортаның өлшем бірлігімен бірдей.
Стандарттық ауытқудың қолданылуы
Педиатрияда стандарттық ауытқуды балалардың физикалық дамуын бағалау үшін қолданады: ол нақты баланың деректерін сәйкес стандарттық көрсеткіштермен салыстыру арқылы жүзеге асады. Стандарт ретінде сау балалардың физикалық дамуларының көрсеткіштерінің орта мәні алынады. Көрсеткіштерді стандартпен салыстыруды арнайы кесте арқылы жүргізеді, кестеде стандарттар оларға сәйкес келетін сигмальді шкалалармен бірге келтіріледі.
Егер баланың физикалық дамуының көрсеткіші стандарт ± ішінде болса, онда баланың физикалық дамуы (осы көрсеткіш бойынша) қалыпқа сәйкес деп саналады. Егер көрсеткіш стандарт ±2 ішінде жатса, онда қалыптан айтарлықтай емес (субнорма) ауытқу бар. Егер көрсеткіш бұл шекаралардан шығып кетсе, онда баланың физикалық дамуында қалыптан күрт айырмашылық бар (паталогия болуы мүмкін).
Процентильдер (перцентильдер, percentile)
Процентильдер – бұл вариациялық қатарды тең 100 бөлікке бөлетін мәндер. Бақылаудын 1%-ы орналасқанға дейінгі х шамасы (бақылаудын 99%-ы х мәнінен жоғары жатады) бірінші процентиль деп аталады. Бақылаудың 2%-ы орналасқанға дейінгі х шамасы екінші процентиль деп аталады және т.с.с.
Вариациялық қатарды тең 10 бөлікке бөлетін мәндер , яғни 10, 20, 30, ..., 90 – шы процентильдер децильдер деп аталады.
Вариациялық қатарды тең 4 бөлікке бөлетін мәндер, яғни 25 – ші, 50 – ші және 75 – ші процентильдер квартильдер деп аталады. 50 – ші процентиль – медиана. Квартильдерді Q таңбасымен белгілейді және олар екеу: төменгі немесе бірінші квартиль(Q1) және жоғарғы немесе үшінші квартиль (Q3)деп аталады.
Бірінші квартиль Q1 вариациялық қатарды екі бөлікке бөлетін сан: бақылаулардың 25 %-ы бірінші квартильге дейін орналасады, 75% - ы одан кейін орналасады.
Үшінші квартиль Q3 вариациялық қатарды екі бөлікке бөлетін сан: бақылаулардың 75% -ы үшінші квартильден кіші, 25% - ы одан үлкен.
Квартильдерді табу үшін вариациялық қатарды медианамен тең екі бөлікке бөлу керек, сосын олардың әрқайсысының медианасын табу керек.
Мысалы, егер таңдама көлемі n=6 болса, онда таңдаманың бірінші квартилі үшін екінші варианта, ал үшінші квартиль үшін бесінші варианта алынады.
1 3 4 6 7 8
таңдамасында Q1 = 3, Q3 = 7.
Егер таңдама көлемі n=8 болса, онда бірінші квартиль үшін 2-ші және 3–ші варианталардың арифметикалық ортасы, ал үшінші квартиль үшін 6-ші және 7 –ші варианталардың арифметикалық ортасы алынады:
1 3 5 6 6 7 8 8
таңдамасында Q1=(3+5)/2=4, Q3=(7+8)/2=7,5.
Егер таңдама көлемі тақ сан болса, онда екі бөлікке де медиана кіреді.
Егер n=9 болса, онда бірінші квартиль үшін 3–ші варианта, ал үшінші квартиль үшін 7-ші варианта алынады:
2 4 5 6 8 9 10 11 12
таңдамасында Q1 =5 және Q3 = 10 тең.
Квартильаралық құлаш бірінші және үшінші квартильдердің, яғни 25- ші және 75 – ші процентильдердің арасындағы айырма. Оған вариациялық қатардың ортаңғы 50% бақылаулары кіреді және бақылаулардың 25% -ы ортаңғы нүктеден төмен, 25% - ы жоғары жатады.
Интердецильді құлаштың ішінде ортаңғы 80% бақылаулар, яғни 10– шы мен 90 – шы процентильдердің арасында орналасқан бақылаулар жатады.
Көбіне 95% бақылаулар жататын құлашты қолданады, яғни төменгі жақтан 2,5% және жоғары жақтан 2,5% бақылаулар шығарылып тасталынады. Бұл аралықты аурудың диагностикасын жүзеге асырғанда қолдануға болады. Бұл жағдайда ол референтті аралық немесе қалыпты құлаш деп аталады.
Процентильдердің қолданылуы
Медиананың 25 – ші және 75- ші процентильдерге қатысты орналасуына қарай таралудың қаншалықты асимметриялы екендігін пайымдауға болады.
Лабораториялық көрсеткіштердің қалыптылығының шекаралары ретінде көбінесе 5 –ші және 95-ші процентильдер қолданылады.
Физикалық даму көрсеткіштерін бағалағанда белгілі бір пациенттің көрсеткіші 3–ші процентильден аз болса, ол күрт төмен деп бағаланады, мәндері бойынша 3 – ші және 10-шы процентильдердің арасында жатса төмен, 25 – ші мен 75 – ші процентильдердін арасында (квартильаралық құлаш) жатса – орта, сол сияқты 75 – ші мен 90 –шының арасында – ортадан жоғары, 90 – шы мен 97 – шінің арасында – жоғары, 97–ші процентильден жоғары орналасса – күрт жоғары деп бағаланады.
Қорытынды: Егер таңдама қалыпты таралған бас жиынтықтан алынғаны белгілі болса, онда таңдама орта мен таңдама стандарттық ауытқуды қолдану керек. Егер жиынтық қалыпты таралу заңына бағынбайтындығы жөнінде негіз болса, онда медиананы және 25–ші және 75- ші процентильдерді қолдану керек.
Мысал: Көлемдері және медианалары бірдей екі таңдама алайық және олардың қалыпты таралмаған бас жиынтықтардан алынғаны белгілі. Орта мәнге қатысты мәндердің шашырау дәрежесін анықтау керек.
n1 = 28 n2 = 28
Me = 10 Me = 10
Шешуі: Х және У таңдамалары үшін сәйкес Q1 мен Q3 – ті табамыз.
Х: Q1 = 9; Q3 =11 У: Q1=7; Q3=12
Х үшін квартильаралық У үшін квартильаралық
құлаш Q3 – Q1= 2 құлаш Q3-Q1 =5
Қорытынды: Деректердің орталық мәннің айналасында шашылуы У таңдамасында үлкен.
Вариация коэффициенті ( ) - стандарттық ауытқудың орта арифметикалық шамаға проценттік қатынасы:
Вариация коэффициенті – бұл вариациялық қатардың өзгергіштігінің салыстырмалы өлшемі.
Вариация коэффициентінің қолданылуы.
Әрбір нақты вариациялық қатардың әртүрлілігін бағалау және, сәйкес, әр орта мәннің типтілігін пайымдау үшін. <10% болғанда қатардың әртүрлілігі әлсіз, 10% < < 20% - орта, ал >20% - күшті болып саналады. Қатардың әртүрлілігінің күшті болуы сәйкес орта шаманың типтілігінің аз екендігін көрсетеді, сондықтан оны практикалық мақсатта қолдану маңызды емес.
ҮЛГІ-ЕСЕП
Есептің шарты. N қаласында 2000 ж. 7жасар ұл балалардың дене салмақтарын өлшеу жүргізілді. N қаласында 1990 ж. жүргізілген осыған ұқсас зерттеудің деректері бойынша 7-жасар ұл балалардың орташа дене салмақтары 23,8 кг, S =± 3,6 кг.болған.
Тапсырма. 1. Орта арифметикалық шаманы ( ) және вариациялық қатардың әртүрлілік критерийлерін (S, ) есептеңдер.
2. Алынған нәтижелерді бағалаңдар, оларды алдыңғы зерттеудің деректерімен салыстырыңдар, сәйкес қорытынды жасаңдар.
ЕСЕПТІҢ ШЕШУІ
N қаласында 2000 ж. 7 жасар ұл балалардың дене салмақтарын өлшеу нәтижелері.
Топталған вариациялық қатарда ортадағы варианта көрші интервалдардың бастапқы варианттарының жарты қосындысы ретінде есептеледі.
Қорытынды:
1 N қаласында 2000 ж. 7жасар ұл балалардың дене салмақтарының орташа мәні 24,0 кг.
2. S= ±4,68 кг.
3. 19,5% -ке тең вариация коэффициентінің мәні белгінің әртүрлілігінің күштіге жақын орта екендігін көрсетеді.
Сонымен, дене салмағының алынған орташа мәні зерттеліп отырған жиынтық үшін жеткілікті типті деп санауға болады. Салыстыру нәтижесінде 1990 ж. қарағанда 2000 ж. 7 жасар ұл балалардың дене салмақтарында әлдеқайда үлкен вариабельділік бар екендігі белгілі болды. (4,68 кг қарсы 3,6 кг). Осыған ұқсас қорытынды вариация коэффициенттерін салыстырғаннан да келіп шығады (1990 ж. тең (3,6*100)/23,8 =15,1%).
Мысал. Өте үлкен ампулалар партиясынан көлемі 50 болатын кездейсоқ таңдама алынды. Х белгісі – 1 см-ге дейінгі дәлдікпен өлшенген ампулалардың ұзындығы келесі вариациялық қатар түрінде берілген: 22, 24, 26, 26, 27, 28, 28, 31, 31, 31, 32, 32, 33, 33, 33, 33, 34, 34, 34, 34, 34, 35, 35, 36, 36, 36, 36, 36, 37, 37, 37, 37, 37, 37, 38, 38, 40, 40, 40, 40, 40, 41, 41, 43, 44, 44, 45, 45, 47, 50. Таралудың статистикалық дискретті, интервалдық қатарларын, мода, медиана, таңдама ортасын, дисперсияны, орта квадраттық ауытқу, сенімділік интервалын табу керек және тең қадаммен жиілік және салыстырмалы жиілік гистограммасын тұрғызу керек.
Шешімі. Таңдаманың дискретті статистикалық таралуы
Мода М0=37. Медиана
Таңдама орта
Таңдама дисперсия
Таңдама орта квадраттық ауытқу деп таңдама дисперсиядан алынған квадрат түбірді айтады: .
Таңдама ортаның стандартты қатесі:
Алынған таңдамалық зерттеулерді жүйелендіруде таралудың статистикалық дискретті және интервалды қатарлар қолданылады.
Вариациялық қатар - сәйкес жиіліктерімен бірге ранжирленген ретпен орналасқан белгінің сандық мәндері.
Вариациялық қатардың негізгі белгіленулері:
- варианта, зерттеліп отырған белгінің сандық өрнектелуі;
- вариантаның жиілігі (“салмақ”), оның вариациялық қатарда қайталану саны;
n - бақылаудың жалпы саны, таңдама көлемі (яғни, барлық жиіліктердің қосындысы, n=Σ );
- вариациялық қатарды шектейтін шеткі варианталар, (қатардың лимиттері);
- қатардың амплитудасы (яғни, ең жоғарғы және ең төменгі варианталардың айырымы ).
Таңдаманың сандық сипаттамалары
Вариациялық қатарлар мен таңдама деректерінің графиктік кескінделулері таңдама жиынтықтағы белгінің қалай түрленетіні жөнінде көрнекі түрде ақпарат бере алады. Бірақ олар таңдаманы толық сипаттау үшін жеткіліксіз, бұл мақсатта жалпылайтын сандық сипаттамаларды қолдану керек.
Таңдаманың сандық сипаттамалары бақылау деректері жөнінде сандық мәлімет береді және оларды өзара салыстыруға мүмкіндік береді. Практикалық маңызы ең жоғары сандық сипаттамаларға таңдама таралулардың орын (таңдама таралудың ортасының орнын анықтайды) және шашырау сипаттамалары жатады. Орын сипаттамаларына таңдама орта, медиана және мода жатады.
Вариациялық қатардың қолданылуы:
Вариациялық қатар орта шаманы ( ) және әртүрлілік критерийлерін ( )анықтау үшін қолданылады.
Орта шама – зерттеліп отырған белгі өлшемінің жалпылама сипаттамасы. Ол бір санмен сапалы біртекті жиынтықты сандық сипаттауға мүмкіндік береді.
Бас жиынтықтан таңдама алынсын, және х1-n1 рет, х2-n2 рет, ..., хk-nk рет қайталанады, ал -таңдама көлемі. х1 мәндерін варианталар деп, ал өсу ретімен жазылған варианталар тізбегін вариациялық қатар деп атайды. Қарастырылатын мәндер санын жиіліктер, ал олардың таңдама көлеміне қатынасын салыстырмалы жиіліктер - деп айтады.
Таңдаманың статистикалық таралуы деп варианталар мен оларға сәйкес жиіліктер немесе салыстырмалы жиіліктердің тізімі аталады.
- Статистикалық таралуды интервалдар тізбегі және оларға сәйкес жиіліктер (интервалға сәйкес жиілік ретінде осы интервалға түскен жиіліктер қосындысын қабылдайды) тізбегі түрінде беруге болады.
- Мода (Мо) – кездейсоқ шаманың ең жиі кездесетін мәні
- Медиана (Ме) – таңдаманы қақ ортасынан бөлетін кездейсоқ шаманың мәні. Барлық мәндерді ранжрленген қатарға орналастыру керек.
- Минимал мәні
- Максимал мәні
- Құлаш
- Орташа қатесі (стандартты) – таңдама көрсеткіштің (статистика) оның генеральды параметрінен ауытқу шамасы:
Медиана(Ме) вариациялық қатарды тең екіге бөлетін мән, одан төмен және одан жоғары мәндердің бірдей саны орналасады және медианаға дейін одан кіші мәндердің 50% - ы, одан кейін үлкен мәндердің 50% -ы жатады.
Егер бақылаулар саны n тақ болса , онда медиананы есептеу жеңіл. Бұл вариациялық қатардағы – ші нөмірлі варианта болады. Мысалы, егер n=11 болса, онда медиана вариациялық қатардағы 6–шы нөмірлі варианта болады. Егер n жұп болса, онда медиана вариациялық қатардағы - ші және – ші нөмірлі варианталардың арифметикалық ортасы болады. Мысалы, егер n= 20 болса, онда медиана = 10- шы және + 1=11- нөмірлі варианталардың арифметикалық ортасы болады.
Егер деректердің таралуы симметриялы болса, онда медиана орта мәнге ұқсас, егер деректердің таралуы оң жаққа қарай қисайған асимметриялы болса, онда орта мәннен кіші, егер деректердің таралуы сол жаққа қарай қисайған асимметриялы болса, онда медиана орта мәннен үлкен.
Мода (moda, mo)
Мода (Мо) – деректер жиынында ең жиі кездесетін мән, егер деректер үздіксіз болса, онда оларды топтастырып модальды топты анықтайды. Кейбір деректер жиынында мода болмайды, себебі әрбір мән тек бір рет кездеседі. Кейде модалар бірнешеу болуы мүмкін, ол біртекті емес жиынтықтарда кездеседі. Мода жалпылайтын сипаттама ретінде өте сирек қолданылады.
Бас орта
бас орта деп бас жиынтық белгісінің орта арифметикалық мәнін айтады.
Егер N көлемді бас жиынтық белгісінің барлық х1,......хN мәндері әртүрлі болса, онда
Егер x1, x2,….xк белгісінің мәндері сәйкесінше N1, N2, …….Nk жиіліктерге ие болса, мұнда N1+ N2+....+.Nk=N
;
Таңдама орта
Х сандық белгісіне қатысты бас жиынтықты зерттеу үшін n көлемді таңдама алынсын.
таңдама орта деп таңдама жиынтық белгісінің орта арифметикалық мәнін айтады.
Егер n көлемді таңдаманың барлық x1, x2,….xn мәндері әр түрлі болса, онда
Егер таңдаманың x1, x2,….xк мәндерінің сәйкесінше жиіліктері n1, n2,……..nk болса, және n1+n2+…..+nk=n онда , немесе
Көлемі n – ге тең Х сандық белгінің мәндер жиынтығын қарастырамыз.
Белгінің мәні | х1 | х2 | … | хк |
Жиілік | п1 | n2 | … | пк |
Шашырау сипаттамалары
Орта мәндер өзгермелі белгілер жөнінде толық ақпарат бермейді. Мәселен, екі таңдаманың таралуларының орта мәндері бірдей болулары мүмкін, бірақ олардың біреуінде белгілердің мәндері орта мәннің айналасына жақын орналасуы, ал екіншісінде алыс орналасулары мүмкін. Сондықтан орта мәндермен қатар таңдаманың шашырау сипаттамаларын да есептейді.
Шашырау көрсеткіштеріне таңдаманың дисперсиясы, стандарттық ауытқу, таңдаманың құлашы, процентильдер(квартильдер),вариация коэффициенті, квартильаралық құлаш жатады.
Бас дисперсия
Бас жиынтықтың Х сандық белгісі мәндерінің өз орта мәнінің маңайында шашырауын сипаттау үшін бас дисперсия сипаттамасы енгізіледі.
бас дисперсиясы деп бас жиынтық белгісі мәндерінің орта мәнінен ауытқуының квадратының орта арифметикалық мәнін айтады.
Егер N көлемді бас жиынтық белгісінің барлық х1, х2 ,.., хN мәндері әртүрлі болса, онда
Егер белгінің барлық х1, х2 ,.., хк мәндерінің сәйкес жиіліктері N1, N2, …, Nk бар болса, және N1+N2+ +…+Nk=N, онда ;
Бас жиынтықтың сандық белгісі мәндерінің өз орта мәнінің маңайында шашырауын сипаттау үшін дисперсиядан басқа Стандарттық ауытқуды пайдаланады.
Бас орташа квадраттық ауытқу деп бас дисперсиядан алынған квадрат түбірді айтады: .
Таңдама дисперсия S2 деп белгінің бақыланатын мәндерінің орта мәнінен ауытқу квадраттарының орта арифметикалық мәнін айтады.
Егер n көлемді таңдаманың барлық x1, x2,….xn белгілерінің мәндері әр түрлі болса, онда
Егер x1, x2,….xn мәндерінің жиіліктері бар және сәйкесінше n1, n2, …, nk болса, мұндағы
n1+ n2+ …+ nk=n, онда .
Теорема: Дисперсия таңдама мәндерінің квадраттарының орта мәні мен орта мәнінің квадратының айырымына тең: .
Стандарттық ауытқу ( standart deviation, SD )
Стандарттық ауытқу(орта квадраттық ауытқу) деректер мәндерінің түрленгіштігін бейнелейді және оны деректер жиынының өзгергіштігін айқындау үшін қолданады. Стандарттық ауытқу – дисперсиядан алынған оң түбір.
Бұл көрсеткіш неғұрлым үлкен болса, өлшенген айнымалының шашырауы соғұрлым үлкен. Стандарттық ауытқулардың өлшем бірлігі таңдама ортаның өлшем бірлігімен бірдей.
Стандарттық ауытқудың қолданылуы
Педиатрияда стандарттық ауытқуды балалардың физикалық дамуын бағалау үшін қолданады: ол нақты баланың деректерін сәйкес стандарттық көрсеткіштермен салыстыру арқылы жүзеге асады. Стандарт ретінде сау балалардың физикалық дамуларының көрсеткіштерінің орта мәні алынады. Көрсеткіштерді стандартпен салыстыруды арнайы кесте арқылы жүргізеді, кестеде стандарттар оларға сәйкес келетін сигмальді шкалалармен бірге келтіріледі.
Егер баланың физикалық дамуының көрсеткіші стандарт ± ішінде болса, онда баланың физикалық дамуы (осы көрсеткіш бойынша) қалыпқа сәйкес деп саналады. Егер көрсеткіш стандарт ±2 ішінде жатса, онда қалыптан айтарлықтай емес (субнорма) ауытқу бар. Егер көрсеткіш бұл шекаралардан шығып кетсе, онда баланың физикалық дамуында қалыптан күрт айырмашылық бар (паталогия болуы мүмкін).
Процентильдер (перцентильдер, percentile)
Процентильдер – бұл вариациялық қатарды тең 100 бөлікке бөлетін мәндер. Бақылаудын 1%-ы орналасқанға дейінгі х шамасы (бақылаудын 99%-ы х мәнінен жоғары жатады) бірінші процентиль деп аталады. Бақылаудың 2%-ы орналасқанға дейінгі х шамасы екінші процентиль деп аталады және т.с.с.
Вариациялық қатарды тең 10 бөлікке бөлетін мәндер , яғни 10, 20, 30, ..., 90 – шы процентильдер децильдер деп аталады.
Вариациялық қатарды тең 4 бөлікке бөлетін мәндер, яғни 25 – ші, 50 – ші және 75 – ші процентильдер квартильдер деп аталады. 50 – ші процентиль – медиана. Квартильдерді Q таңбасымен белгілейді және олар екеу: төменгі немесе бірінші квартиль(Q1) және жоғарғы немесе үшінші квартиль (Q3)деп аталады.
Бірінші квартиль Q1 вариациялық қатарды екі бөлікке бөлетін сан: бақылаулардың 25 %-ы бірінші квартильге дейін орналасады, 75% - ы одан кейін орналасады.
Үшінші квартиль Q3 вариациялық қатарды екі бөлікке бөлетін сан: бақылаулардың 75% -ы үшінші квартильден кіші, 25% - ы одан үлкен.
Квартильдерді табу үшін вариациялық қатарды медианамен тең екі бөлікке бөлу керек, сосын олардың әрқайсысының медианасын табу керек.
Мысалы, егер таңдама көлемі n=6 болса, онда таңдаманың бірінші квартилі үшін екінші варианта, ал үшінші квартиль үшін бесінші варианта алынады.
1 3 4 6 7 8
таңдамасында Q1 = 3, Q3 = 7.
Егер таңдама көлемі n=8 болса, онда бірінші квартиль үшін 2-ші және 3–ші варианталардың арифметикалық ортасы, ал үшінші квартиль үшін 6-ші және 7 –ші варианталардың арифметикалық ортасы алынады:
1 3 5 6 6 7 8 8
таңдамасында Q1=(3+5)/2=4, Q3=(7+8)/2=7,5.
Егер таңдама көлемі тақ сан болса, онда екі бөлікке де медиана кіреді.
Егер n=9 болса, онда бірінші квартиль үшін 3–ші варианта, ал үшінші квартиль үшін 7-ші варианта алынады:
2 4 5 6 8 9 10 11 12
таңдамасында Q1 =5 және Q3 = 10 тең.
Квартильаралық құлаш бірінші және үшінші квартильдердің, яғни 25- ші және 75 – ші процентильдердің арасындағы айырма. Оған вариациялық қатардың ортаңғы 50% бақылаулары кіреді және бақылаулардың 25% -ы ортаңғы нүктеден төмен, 25% - ы жоғары жатады.
Интердецильді құлаштың ішінде ортаңғы 80% бақылаулар, яғни 10– шы мен 90 – шы процентильдердің арасында орналасқан бақылаулар жатады.
Көбіне 95% бақылаулар жататын құлашты қолданады, яғни төменгі жақтан 2,5% және жоғары жақтан 2,5% бақылаулар шығарылып тасталынады. Бұл аралықты аурудың диагностикасын жүзеге асырғанда қолдануға болады. Бұл жағдайда ол референтті аралық немесе қалыпты құлаш деп аталады.
Процентильдердің қолданылуы
Медиананың 25 – ші және 75- ші процентильдерге қатысты орналасуына қарай таралудың қаншалықты асимметриялы екендігін пайымдауға болады.
Лабораториялық көрсеткіштердің қалыптылығының шекаралары ретінде көбінесе 5 –ші және 95-ші процентильдер қолданылады.
Физикалық даму көрсеткіштерін бағалағанда белгілі бір пациенттің көрсеткіші 3–ші процентильден аз болса, ол күрт төмен деп бағаланады, мәндері бойынша 3 – ші және 10-шы процентильдердің арасында жатса төмен, 25 – ші мен 75 – ші процентильдердін арасында (квартильаралық құлаш) жатса – орта, сол сияқты 75 – ші мен 90 –шының арасында – ортадан жоғары, 90 – шы мен 97 – шінің арасында – жоғары, 97–ші процентильден жоғары орналасса – күрт жоғары деп бағаланады.
Қорытынды: Егер таңдама қалыпты таралған бас жиынтықтан алынғаны белгілі болса, онда таңдама орта мен таңдама стандарттық ауытқуды қолдану керек. Егер жиынтық қалыпты таралу заңына бағынбайтындығы жөнінде негіз болса, онда медиананы және 25–ші және 75- ші процентильдерді қолдану керек.
Мысал: Көлемдері және медианалары бірдей екі таңдама алайық және олардың қалыпты таралмаған бас жиынтықтардан алынғаны белгілі. Орта мәнге қатысты мәндердің шашырау дәрежесін анықтау керек.
xi | 7 | 8 | 9 | 10 | 11 | 12 | 13 | yi | 7 | 8 | 9 | 10 | 11 | 12 | 13 | |
ni | 1 | 3 | 5 | 10 | 5 | 3 | 1 | ni | 8 | 2 | 1 | 4 | 1 | 8 | 4 |
n1 = 28 n2 = 28
Me = 10 Me = 10
Шешуі: Х және У таңдамалары үшін сәйкес Q1 мен Q3 – ті табамыз.
Х: Q1 = 9; Q3 =11 У: Q1=7; Q3=12
Х үшін квартильаралық У үшін квартильаралық
құлаш Q3 – Q1= 2 құлаш Q3-Q1 =5
Қорытынды: Деректердің орталық мәннің айналасында шашылуы У таңдамасында үлкен.
Вариация коэффициенті ( ) - стандарттық ауытқудың орта арифметикалық шамаға проценттік қатынасы:
Вариация коэффициенті – бұл вариациялық қатардың өзгергіштігінің салыстырмалы өлшемі.
Вариация коэффициентінің қолданылуы.
Әрбір нақты вариациялық қатардың әртүрлілігін бағалау және, сәйкес, әр орта мәннің типтілігін пайымдау үшін. <10% болғанда қатардың әртүрлілігі әлсіз, 10% < < 20% - орта, ал >20% - күшті болып саналады. Қатардың әртүрлілігінің күшті болуы сәйкес орта шаманың типтілігінің аз екендігін көрсетеді, сондықтан оны практикалық мақсатта қолдану маңызды емес.
ҮЛГІ-ЕСЕП
Есептің шарты. N қаласында 2000 ж. 7жасар ұл балалардың дене салмақтарын өлшеу жүргізілді. N қаласында 1990 ж. жүргізілген осыған ұқсас зерттеудің деректері бойынша 7-жасар ұл балалардың орташа дене салмақтары 23,8 кг, S =± 3,6 кг.болған.
Тапсырма. 1. Орта арифметикалық шаманы ( ) және вариациялық қатардың әртүрлілік критерийлерін (S, ) есептеңдер.
2. Алынған нәтижелерді бағалаңдар, оларды алдыңғы зерттеудің деректерімен салыстырыңдар, сәйкес қорытынды жасаңдар.
ЕСЕПТІҢ ШЕШУІ
N қаласында 2000 ж. 7 жасар ұл балалардың дене салмақтарын өлшеу нәтижелері.
Дене салмағы (кг) | Интервалдың ортасы (ортадағы варианта) | Ұл балалар саны | ||||
15-18,9 | 17 | 16 | 272 | -7 | 49 | 784 |
19-22,9 | 21 | 27 | 567 | -3 | 9 | 243 |
23-26,9 | 25 | 32 | 800 | +1 | 1 | 32 |
27-30,9 | 29 | 16 | 464 | +5 | 25 | 400 |
31-34,9 | 33 | 9 | 297 | +9 | 81 | 729 |
Топталған вариациялық қатарда ортадағы варианта көрші интервалдардың бастапқы варианттарының жарты қосындысы ретінде есептеледі.
Қорытынды:
1 N қаласында 2000 ж. 7жасар ұл балалардың дене салмақтарының орташа мәні 24,0 кг.
2. S= ±4,68 кг.
3. 19,5% -ке тең вариация коэффициентінің мәні белгінің әртүрлілігінің күштіге жақын орта екендігін көрсетеді.
Сонымен, дене салмағының алынған орташа мәні зерттеліп отырған жиынтық үшін жеткілікті типті деп санауға болады. Салыстыру нәтижесінде 1990 ж. қарағанда 2000 ж. 7 жасар ұл балалардың дене салмақтарында әлдеқайда үлкен вариабельділік бар екендігі белгілі болды. (4,68 кг қарсы 3,6 кг). Осыған ұқсас қорытынды вариация коэффициенттерін салыстырғаннан да келіп шығады (1990 ж. тең (3,6*100)/23,8 =15,1%).
Мысал. Өте үлкен ампулалар партиясынан көлемі 50 болатын кездейсоқ таңдама алынды. Х белгісі – 1 см-ге дейінгі дәлдікпен өлшенген ампулалардың ұзындығы келесі вариациялық қатар түрінде берілген: 22, 24, 26, 26, 27, 28, 28, 31, 31, 31, 32, 32, 33, 33, 33, 33, 34, 34, 34, 34, 34, 35, 35, 36, 36, 36, 36, 36, 37, 37, 37, 37, 37, 37, 38, 38, 40, 40, 40, 40, 40, 41, 41, 43, 44, 44, 45, 45, 47, 50. Таралудың статистикалық дискретті, интервалдық қатарларын, мода, медиана, таңдама ортасын, дисперсияны, орта квадраттық ауытқу, сенімділік интервалын табу керек және тең қадаммен жиілік және салыстырмалы жиілік гистограммасын тұрғызу керек.
Шешімі. Таңдаманың дискретті статистикалық таралуы
22 | 24 | 26 | 27 | 28 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 40 | 41 | 43 | 44 | 45 | 47 | 50 | |
1 | 1 | 2 | 1 | 2 | 3 | 2 | 4 | 5 | 2 | 5 | 6 | 2 | 5 | 2 | 1 | 2 | 2 | 1 | 1 | |
0,02 | 0,02 | 0,04 | 0,02 | 0,04 | 0,06 | 0,04 | 0,08 | 0,1 | 0,04 | 0,1 | 0,12 | 0,04 | 0,1 | 0,04 | 0,02 | 0,04 | 0,04 | 0,02 | 0,02 |
Мода М0=37. Медиана
Таңдама орта
Таңдама дисперсия
Таңдама орта квадраттық ауытқу деп таңдама дисперсиядан алынған квадрат түбірді айтады: .
Таңдама ортаның стандартты қатесі:
Ctrl
Enter
Заметили ошЫбку
Выделите текст и нажмите Ctrl+Enter
Написать комментарий
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.