Пример статистической обработки выборки нашим сервисом:
(статистические ряды, полигоны частот, гистограмма, функция распределения, математическое ожидание, дисперсия)
Заметьте! Решение вашей конкретной задачи будет выглядеть аналогично данному примеру, включая все таблицы и поясняющие тексты, представленные ниже, но с учетом ваших исходных данных…
Задача:
Дана выборка из 280 элементов (x1 x2 … x280):
0.34140001 0.05440002 0.56650003 0.57290004 0.52210005 1.04810006 0.20630007 0.42330008 0.07650009 0.69720010 0.51630011 0.88180012 0.18650013 0.17910014 0.94680015 0.10720016 1.56170017 1.18700018 0.15530019 0.44800020 0.58210021 0.98180022 1.06170023 0.06520024 3.71570025 1.83440026 0.74580027 0.75400028 0.01070029 0.20800030 0.57070031 0.03530032 0.09610033 1.77040034 0.24730035 0.48910036 0.11720037 0.60370038 1.02790039 0.69480040 0.23940041 0.60250042 0.23990043 0.57440044 0.01050045 0.80140046 1.80420047 0.45470048 0.15940049 0.73040050 0.23850051 0.13130052 0.46850053 0.20880054 0.31420055 0.24770056 0.05900057 0.87010058 0.47430059 0.10350060 0.04240061 0.46400062 0.19730063 1.24520064 0.68120065 0.23910066 0.60180067 0.13840068 0.38420069 1.90740070 0.83350071 0.11280072 0.42200073 0.73350074 0.13840075 0.51900076 1.00300077 1.25200078 0.18680079 0.12190080 0.10840081 1.23420082 0.04550083 0.14260084 2.07120085 0.04350086 0.24320087 1.48300088 1.34630089 0.15510090 0.10510091 0.19470092 0.49450093 0.14890094 0.03000095 1.96870096 0.24590097 0.24110098 0.07860099 0.17040100 0.05170101 0.30010102 0.18810103 0.39890104 0.36360105 0.49060106 0.56150107 0.23070108 0.05980109 0.30590110 0.46180111 0.66180112 0.64310113 0.71810114 0.19270115 0.23410116 0.84410117 0.06660118 0.58140119 0.46690120 0.07060121 0.38720122 0.31620123 0.02930124 0.36350125 0.67080126 0.91150127 0.21490128 0.13790129 0.02400130 0.23680131 3.06680132 0.59520133 0.96000134 0.76500135 0.02660136 0.19710137 0.24530138 0.28170139 0.54820140 1.00750141 0.90340142 0.15310143 1.54070144 0.37120145 0.43050146 0.69890147 1.34170148 1.08660149 0.56810150 0.37560151 0.95970152 0.79060153 0.10070154 0.53980155 0.44890156 0.16000157 0.00090158 0.02790159 0.17460160 0.11380161 0.41970162 0.74430163 0.25430164 1.04000165 0.17370166 0.61060167 0.05110168 0.28370169 0.64040170 0.83040171 0.21860172 0.41190173 0.14630174 0.36070175 0.14910176 0.07130177 0.58140178 2.80450179 1.30630180 0.11380181 0.03430182 0.15600183 0.07780184 0.04720185 0.27490186 0.32990187 1.49980188 1.64030189 0.00240190 0.02500191 0.44240192 1.54460193 0.94420194 0.64160195 1.09490196 0.30040197 0.04130198 0.76200199 0.75770200 0.35380201 0.60520202 0.31540203 0.32420204 0.13910205 0.61200206 0.02160207 0.13700208 1.61860209 0.23100210 0.83140211 1.28080212 0.87310213 0.06160214 0.34510215 0.94480216 0.74920217 0.77610218 0.02140219 0.41200220 0.09400221 0.16230222 0.63930223 0.12660224 1.72260225 1.67580226 0.37480227 0.54880228 0.08420229 0.91460230 1.07240231 1.67460232 0.39210233 1.21220234 0.35260235 0.02640236 0.46800237 0.78170238 0.33670239 1.24490240 0.03980241 1.28270242 0.41340243 0.04290244 0.69580245 0.64100246 0.98060247 2.50540248 0.48580249 0.22810250 2.15280251 0.67250252 3.79000253 0.00050254 0.37570255 0.67270256 0.42080257 1.86630258 0.26490259 0.28020260 1.15880261 0.13390262 0.01460263 0.49410264 0.88260265 0.33200266 0.28140267 0.27690268 0.66070269 1.29850270 0.96480271 0.53880272 0.32880273 0.50510274 0.65110275 0.15950276 0.02530277 1.36220278 0.14050279 0.69730280
Требуется построить (вычислить): - группированный статистический ряд абсолютных частот из 21 члена(ов); - группированный статистический ряд относительных частот из 21 члена(ов); - полигон абсолютных частот; - полигон относительных частот; - гистограмму относительных частот; - эмпирическую функцию распределения; - выборочное среднее (Оценку математического ожидания); - выборочную дисперсию (Оценку дисперсии);
РЕШЕНИЕ:
1. Строим группированный статистический ряд абсолютных частот.Группированным статистическим рядом абсолютных частот называется последовательность пар чисел
(x1* , n1*) ,
(x2* , n2*) ,…,
(xm* , nm*)
где xk* — центр k-го интервала группировки и n1* — число
элементов выборки, попавших в k-й интервал.
Числа nk* ( k = 1,…,m ) называются абсолютными частотами.
1.1. Находим минимальный и максимальный элемент выборки, это 254-й и 253-й элементы соответственно, xmin = 0.00050 и xmax = 3.79000.
1.2. Находим длину интервала группировки h = (xmax - xmin) / m =
( 3.79000 - 0.00050) / 21 = 0.18045. Здесь m = 21 - число интервалов группировки.
1.3. Находим правые границы интервалов группировки: xk = xmin + kh (к = 1,..., 21). Получаем
0.18095 0.36140 0.54186 0.72231 0.90276 1.08321 1.26367 1.44412 1.62457 1.80502 1.98548 2.16593 2.34638 2.52683 2.70729 2.88774 3.06819 3.24864 3.42910 3.60955 3.79000
1.4. Находим центры x*k интервалов группировки по формуле: x*k = xk - h/2 (к = 1,..., 21). Получаем
0.09073 0.27118 0.45163 0.63208 0.81254 0.99299 1.17344 1.35389 1.53435 1.71480 1.89525 2.07570 2.25615 2.43661 2.61706 2.79751 2.97796 3.15842 3.33887 3.51932 3.69977
1.5. Для каждого интервала группировки (xk-1 , xk) находим число nk* элементов выборки, попавших в этот интервал.
Важно чтобы каждый элемент выборки был отнесен к одному и только к одному интервалу, а если значение элемента попадает на границу интервала, то будем относить его к интервалу с младшим номером. Минимальный
элемент всегда относим к первому интервалу, максимальный к последнему. Для облегчения работы воспользуемся приведенной ниже таблицей
Номер Интервала k | Центр Интервала xk* | Границы Интервала | Попало в Интервал nk* | Номера элементов попавших в интервал | 1 | 0.09073 | 0.00050... 0.18095 | 76 | 2 9 14 16 19 24 29 32 33 37 45 49 52 57 60 61 68 72 75 80 81 83 84 86 90 91 94 95 99 100 101 109 118 121 124 129 130 136 143 154 157 158 159 160 161 166 168 174 176 177 181 182 183 184 185 190 191 198 205 207 208 214 219 221 222 224 229 236 241 244 254 262 263 276 277 279 | 2 | 0.27118 | 0.18095... 0.36140 | 51 | 1 7 13 30 35 41 43 51 54 55 56 63 66 79 87 92 97 98 102 103 108 110 115 116 123 128 131 137 138 139 164 169 172 175 186 187 197 201 203 204 210 215 235 239 250 259 260 266 267 268 273 | 3 | 0.45163 | 0.36140... 0.54186 | 39 | 5 8 11 20 36 48 53 59 62 69 73 76 93 104 105 106 111 120 122 125 145 146 151 155 156 162 173 192 220 227 233 237 243 249 255 257 264 272 274 | 4 | 0.63208 | 0.54186... 0.72231 | 36 | 3 4 10 21 31 38 40 42 44 65 67 107 112 113 114 119 126 133 140 147 150 167 170 178 195 202 206 223 228 245 246 252 256 269 275 280 | 5 | 0.81254 | 0.72231... 0.90276 | 21 | 12 27 28 46 50 58 71 74 117 135 153 163 171 199 200 211 213 217 218 238 265 | 6 | 0.99299 | 0.90276... 1.08321 | 18 | 6 15 22 23 39 77 127 134 141 142 152 165 194 216 230 231 247 271 | 7 | 1.17344 | 1.08321... 1.26367 | 9 | 18 64 78 82 149 196 234 240 261 | 8 | 1.35389 | 1.26367... 1.44412 | 7 | 89 148 180 212 242 270 278 | 9 | 1.53435 | 1.44412... 1.62457 | 6 | 17 88 144 188 193 209 | 10 | 1.71480 | 1.62457... 1.80502 | 6 | 34 47 189 225 226 232 | 11 | 1.89525 | 1.80502... 1.98548 | 4 | 26 70 96 258 | 12 | 2.07570 | 1.98548... 2.16593 | 2 | 85 251 | 13 | 2.25615 | 2.16593... 2.34638 | 0 | | 14 | 2.43661 | 2.34638... 2.52683 | 1 | 248 | 15 | 2.61706 | 2.52683... 2.70729 | 0 | | 16 | 2.79751 | 2.70729... 2.88774 | 1 | 179 | 17 | 2.97796 | 2.88774... 3.06819 | 1 | 132 | 18 | 3.15842 | 3.06819... 3.24864 | 0 | | 19 | 3.33887 | 3.24864... 3.42910 | 0 | | 20 | 3.51932 | 3.42910... 3.60955 | 0 | | 21 | 3.69977 | 3.60955... 3.79000 | 2 | 25 253 |
1.6. Убеждаемся, что сумма всех абсолютных частот nk* равна объему выборки 280. 76+51+ ... +2 = 280
ОТВЕТ. Группированный статистический ряд абсолютных частот имеет вид:
xk* | 0.09073 | 0.27118 | 0.45163 | 0.63208 | 0.81254 | 0.99299 | 1.17344 | nk* | 76 | 51 | 39 | 36 | 21 | 18 | 9 |
xk* | 1.35389 | 1.53435 | 1.71480 | 1.89525 | 2.07570 | 2.25615 | 2.43661 | nk* | 7 | 6 | 6 | 4 | 2 | 0 | 1 |
xk* | 2.61706 | 2.79751 | 2.97796 | 3.15842 | 3.33887 | 3.51932 | 3.69977 | nk* | 0 | 1 | 1 | 0 | 0 | 0 | 2 |
2. Строим группированный статистический ряд относительных частот.Группированным статистическим рядом относительных частот называется последовательность пар чисел
(x1* , n1*/n) ,
(x2* , n2*/n) ,…,
(xm* , nm*/n)
где nk*/n — относительные частоты и n - объем
выборки.
2.1. Вычисляем относительные частоты nk*/n, как отношения абсолютных частот к объему выборки.
результат представим в виде таблицы:
Номер Интервала k | Центр Интервала xk* | nk* | nk*/n | 1 | 0.09073 | 76 | 0.27143 | 2 | 0.27118 | 51 | 0.18214 | 3 | 0.45163 | 39 | 0.13929 | 4 | 0.63208 | 36 | 0.12857 | 5 | 0.81254 | 21 | 0.07500 | 6 | 0.99299 | 18 | 0.06429 | 7 | 1.17344 | 9 | 0.03214 | 8 | 1.35389 | 7 | 0.02500 | 9 | 1.53435 | 6 | 0.02143 | 10 | 1.71480 | 6 | 0.02143 | 11 | 1.89525 | 4 | 0.01429 | 12 | 2.07570 | 2 | 0.00714 | 13 | 2.25615 | 0 | 0.00000 | 14 | 2.43661 | 1 | 0.00357 | 15 | 2.61706 | 0 | 0.00000 | 16 | 2.79751 | 1 | 0.00357 | 17 | 2.97796 | 1 | 0.00357 | 18 | 3.15842 | 0 | 0.00000 | 19 | 3.33887 | 0 | 0.00000 | 20 | 3.51932 | 0 | 0.00000 | 21 | 3.69977 | 2 | 0.00714 |
2.2. Убеждаемся, что сумма всех относительных частот nk*/n равна единице.
(допускается небольшое отличие от единицы в рамках погрешности вычислений) 0.27143+ 0.18214+ ... + 0.00714 = 1.00000
ОТВЕТ. Группированный статистический ряд относительных частот имеет вид:
xk* | 0.09073 | 0.27118 | 0.45163 | 0.63208 | 0.81254 | 0.99299 | 1.17344 | nk*/n | 0.27143 | 0.18214 | 0.13929 | 0.12857 | 0.07500 | 0.06429 | 0.03214 |
xk* | 1.35389 | 1.53435 | 1.71480 | 1.89525 | 2.07570 | 2.25615 | 2.43661 | nk*/n | 0.02500 | 0.02143 | 0.02143 | 0.01429 | 0.00714 | 0.00000 | 0.00357 |
xk* | 2.61706 | 2.79751 | 2.97796 | 3.15842 | 3.33887 | 3.51932 | 3.69977 | nk*/n | 0.00000 | 0.00357 | 0.00357 | 0.00000 | 0.00000 | 0.00000 | 0.00714 |
3. Строим полигон абсолютных частот.Полигон абсолютных частот группированного статистического ряда абсолютных частот — это ломаная с вершинами в точках (xk* , nk* ). Полигон является одним из графических представлений выборки. Следует тщательно выбрать масштабы и начальные точки на осях, чтобы полигон был максимально наглядным.
3.1. На оси абсцисс выбираем начальную точку чуть левее точки x1* = 0.09073, и такой масштаб, чтобы на оси
поместился интервал [x1* , x21* ] = [ 0.09073 , 3.69977] и отчетливо различались точки xk*.
3.2. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы на оси поместился интервал
[min{n1*,…,n21* },max{n1*,…,n21* }] = [0 , 76] и отчетливо различались точки nk*.
3.3. На оси абсцисс размещаем значения xk*, а на оси ординат значения nk*.
3.4. Наносим точки (x1*, n1* ),
(x2*, n2* ),…,(x21*, n21* )
на координатную плоскость и последовательно соединяем их отрезками. Получаем полигон, изображенный на рисунке ниже.

4. Строим полигон относительных частот.Полигон относительных частот группированного статистического ряда относительных частот — это ломаная с вершинами в точках (xk* , nk*/n ). Полигон является одним из графических представлений выборки. Следует тщательно выбрать масштабы и начальные точки на осях, чтобы полигон был максимально наглядным.
4.1. На оси абсцисс выбираем начальную точку чуть левее точки x1* = 0.09073, и такой масштаб, чтобы на оси
поместился интервал [x1* , x21* ] = [ 0.09073 , 3.69977] и отчетливо различались точки xk*.
4.2. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы на оси поместился интервал
[min{n1*/n,…,n21*/n},max{n1*/n,…,n21*/n}] = [ 0.00000 , 0.27143] и отчетливо различались точки nk*/n.
4.3. На оси абсцисс размещаем значения xk*, а на оси ординат значения nk*/n.
4.4. Наносим точки (x1*, n1*/n ),
(x2*, n2*/n ),…,(x21*, n21*/n )
на координатную плоскость и последовательно соединяем их отрезками. Получаем полигон, изображенный на рисунке ниже.

5. Строим гистограмму относительных частот.Гистограмма относительных частот — это фигура, состоящая из m прямоугольников, опирающихся на интервалы
группировки. Площадь к-ro прямоугольника полагают равной nk*/n, т.е. относительной частоте
данного интервала.
5.1. Для построения гистограммы заполним таблицу (см.ниже). Для ее заполнения воспользуемся уже известными значениями границ интервалов
и относительных частот представленных в предыдущих двух таблицах, а значения для нового столбца Hk (высота k-го прямоугольника)
рассчитаем по формуле: Hk = (nk*/n)/h
Номер Интервала k | Центр Интервала xk* | Границы Интервала [xk-1 , xk ] | nk*/n | Hk | 1 | 0.09073 | 0.00050... 0.18095 | 0.27143 | 1.50416 | 2 | 0.27118 | 0.18095... 0.36140 | 0.18214 | 1.00937 | 3 | 0.45163 | 0.36140... 0.54186 | 0.13929 | 0.77187 | 4 | 0.63208 | 0.54186... 0.72231 | 0.12857 | 0.71250 | 5 | 0.81254 | 0.72231... 0.90276 | 0.07500 | 0.41562 | 6 | 0.99299 | 0.90276... 1.08321 | 0.06429 | 0.35625 | 7 | 1.17344 | 1.08321... 1.26367 | 0.03214 | 0.17812 | 8 | 1.35389 | 1.26367... 1.44412 | 0.02500 | 0.13854 | 9 | 1.53435 | 1.44412... 1.62457 | 0.02143 | 0.11875 | 10 | 1.71480 | 1.62457... 1.80502 | 0.02143 | 0.11875 | 11 | 1.89525 | 1.80502... 1.98548 | 0.01429 | 0.07917 | 12 | 2.07570 | 1.98548... 2.16593 | 0.00714 | 0.03958 | 13 | 2.25615 | 2.16593... 2.34638 | 0.00000 | 0.00000 | 14 | 2.43661 | 2.34638... 2.52683 | 0.00357 | 0.01979 | 15 | 2.61706 | 2.52683... 2.70729 | 0.00000 | 0.00000 | 16 | 2.79751 | 2.70729... 2.88774 | 0.00357 | 0.01979 | 17 | 2.97796 | 2.88774... 3.06819 | 0.00357 | 0.01979 | 18 | 3.15842 | 3.06819... 3.24864 | 0.00000 | 0.00000 | 19 | 3.33887 | 3.24864... 3.42910 | 0.00000 | 0.00000 | 20 | 3.51932 | 3.42910... 3.60955 | 0.00000 | 0.00000 | 21 | 3.69977 | 3.60955... 3.79000 | 0.00714 | 0.03958 |
5.2. Убеждаемся, что сумма всех высот Hk , умноженная на h, равна единице.
(допускается небольшое отличие от единицы в рамках погрешности вычислений)
1.50416+ 1.00937+ ... + 0.03958 = 5.54163 ; 5.54163* 0.18045 = 1.00000
5.3. На оси абсцисс выбираем начальную точку чуть левее точки x1 = 0.18095, и такой масштаб, чтобы на оси
поместился интервал [x1 , x21 ] = [ 0.18095 , 3.79000] и отчетливо различались точки xk.
5.4. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы отчетливо различались Hk 5.5. Для построения гистограммы относительных частот на ось абсцисс наносим интервалы [xk-1 , xk] и,
используя каждый из них как основание, строим прямоугольник с соответствующей высотой Hk.
Получаем гистограмму, изображенную на рисунке ниже.

6. Строим эмпирическую функцию распределения.Эмпирической функцией распределения называется функция F*(x), определенная для всех х от — ∞ до + ∞;
таких, что:
1) F*(x) = 0, для всех x < x*1;.
2) F*(x) = (n1*/n)+(n2*/n)+…+(nk*/n) для всех x удовлетворяющих условию: хk*≤ x < х*k+1;
3) F*(x) = 1, для всех x ≥ x*m;.
6.1. Для построения функции заполним таблицу (см.ниже), в колонку F*(x) будем записывать накопленные
относительные частоты
F*(x1*) = n1*/n
F*(x2*) = (n1*/n)+(n2*/n)
F*(x3*) = (n1*/n)+(n2*/n)+(n3*/n) и т.д.
Номер Интервала k | Центр Интервала xk* | nk*/n | F*(xk*) | 1 | 0.09073 | 0.27143 | 0.27143 | 2 | 0.27118 | 0.18214 | 0.45357 | 3 | 0.45163 | 0.13929 | 0.59286 | 4 | 0.63208 | 0.12857 | 0.72143 | 5 | 0.81254 | 0.07500 | 0.79643 | 6 | 0.99299 | 0.06429 | 0.86071 | 7 | 1.17344 | 0.03214 | 0.89286 | 8 | 1.35389 | 0.02500 | 0.91786 | 9 | 1.53435 | 0.02143 | 0.93929 | 10 | 1.71480 | 0.02143 | 0.96071 | 11 | 1.89525 | 0.01429 | 0.97500 | 12 | 2.07570 | 0.00714 | 0.98214 | 13 | 2.25615 | 0.00000 | 0.98214 | 14 | 2.43661 | 0.00357 | 0.98571 | 15 | 2.61706 | 0.00000 | 0.98571 | 16 | 2.79751 | 0.00357 | 0.98929 | 17 | 2.97796 | 0.00357 | 0.99286 | 18 | 3.15842 | 0.00000 | 0.99286 | 19 | 3.33887 | 0.00000 | 0.99286 | 20 | 3.51932 | 0.00000 | 0.99286 | 21 | 3.69977 | 0.00714 | 1.00000 |
6.2. На оси абсцисс выбираем начальную точку чуть левее точки x1* = 0.09073, и такой масштаб, чтобы на оси
поместился интервал [x1* , x21* ] = [ 0.09073 , 3.69977] и отчетливо различались точки xk*.
6.3. На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы на оси поместился интервал
[0 , 1] и отчетливо различались точки nk*/n.
6.4. Для построения графика эмпирической функции распределения наносим на ось абсцисс интервалы
[xk* , xk+1*] и над каждым из них на высоте F*(xk* ) строим горизонтальные отрезки.
В правом конце отрезка помещаем стрелку, чтобы показать, что F*(xk* ) в точке x*k+1
делает прыжок в высоту на F*(x*k+1 ) — F*(xk* ) = n*k+1 /n.
Получаем график эмпирической функции распределения, изображенный на рисунке ниже.

7. Вычислим оценку математического ожидания (выборочное среднее) исходной выборки.Оценка математического ожидания (выборочное среднее) не сгруппированной выборки (x1 x2 … x280) вычисляется по формуле: При больших объемах выборки числитель и знаменатель дроби могут принимать большие значения, что, в свою очередь, может
привести к потере точности. Поэтому при практических вычислениях лучше избегать суммирования большого числа слагаемых.
В нашем случае объем выборки n = 280, и поэтому лучше суммировать по 10 элементов:
S1 = x1 +…+ x10, S2 = x11 +…+ x20, - - - - - - - - - - - S28 = x271 +…+ x280,
Затем делим S1, S2,..., S28 на 10.
В дробях | s1 = | | , s2 = | | , s28 = | | числитель и знаменатель не столь велики, как в исходной формуле затем вычисляем
7.1. Складывая последовательно по десять элементов выборки получим следующие значения для Sk :
4.50870 6.16970 9.95940 5.65250 5.61680 3.11590 5.90100 5.32290 6.87300 3.67790 2.95090 4.87060 3.12590 6.92270 8.10170 3.57870 4.33160 6.88050 4.17640 6.55410 4.35790 6.29550 6.34300 7.56160 7.31550 10.49640 5.53350 5.37340
7.2. Каждое из чисел S1, S2,…, S28 делим на 10. Получаем 28 чисел sk = Sk/10 :
0.45087 0.61697 0.99594 0.56525 0.56168 0.31159 0.59010 0.53229 0.68730 0.36779 0.29509 0.48706 0.31259 0.69227 0.81017 0.35787 0.43316 0.68805 0.41764 0.65541 0.43579 0.62955 0.63430 0.75616 0.73155 1.04964 0.55335 0.53734
7.3. Искомая оценка математического ожидания есть
ОТВЕТ. Оценка математического ожидания (выборочное среднее) исходной выборки составляет: 0.577027
8. Вычислим оценку дисперсии (выборочную дисперсию) исходной выборки.Оценка дисперсии, не сгруппированной выборки (x1 x2 … x280) вычисляется по формуле:
D* = |
(x1- M* )2 + (x2- M* )2 + ... + (xn- M* )2 |
|
n-1 |
| = | | | (xn- M* )2, | где M*— оценка математического ожидания (выборочное среднее). Вычисляем выборочную дисперсию по указанной формуле с n = 280. Получаем
D* = |
(0.3414- 0.577027)2 + (0.0544- 0.577027)2 + ... + (0.6973- 0.577027)2 |
|
279 |
| = 0.343907 |
ОТВЕТ. Оценка дисперсии исходной выборки составляет : 0.343907
см. пример обработки ряда абсолютных частот...
решить мою задачу...
на ввод условия...
к списку решаемых задач...
|