Математична статика. Навчальний посібник: Математична статистика

Математична статистика – це розділ математики, присвячений математичним методам систематизації, обробки та використання статистичних даних для наукових та практичних цілей.

Статистичними даними називаються відомості про кількість і характер об'єктів у будь-якій більш менш широкої сукупності, що володіють тими чи іншими властивостями.

p align="justify"> Метод дослідження, що спирається на розгляд статистичних даних від тих чи інших сукупностей об'єктів, називається статистичним.

Формальна математична сторона статистичних методів дослідження байдужа до природи об'єктів, що досліджуються, і становить предмет математичної статистики.

Основне завдання математичної статистики полягає у отриманні висновків про масові явища та процеси за даними спостережень над ними чи експериментів.

Статистика – наука, що дозволяє побачити закономірності у хаосі випадкових даних, виділити які у зв'язку у яких і визначити наші дії, щоб збільшити частку правильно прийнятих рішень.

Багато відомих зараз залежності між різними аспектами навколишнього світу отримано шляхом аналізу накопичених людством даних. Після статистичного виявлення залежностей людина знаходить те чи інше раціональне пояснення виявленим закономірностям.

Для викладу початкових визначень статистики звернімося, наприклад.

приклад. Припустимо, необхідно оцінити рівень зміни коефіцієнта інтелектуальності за 3 роки навчання у 100 студентів. Як показник розглянемо ставлення нинішнього коефіцієнта до раніше виміряного коефіцієнта (три роки тому), помноженого на 100%.

Отримаємо послідовність 100 випадкових величин: 97,8; 97,0; 101,7; 132,5; 142; …; 122. Позначимо її через Х.

Визначення 1. Послідовність спостережуваних результаті дослідження випадкових величин Х у статистиці називається ознакою.

Визначення 2.Різні значення ознаки називаються варіантами.

З наведених значень варіант важко отримати деяку інформацію про динаміку зміни коефіцієнта інтелектуальності у процесі навчання. Упорядкуємо цю послідовність за зростанням: 94; 97,0; 97,8; …142. З отриманої послідовності вже можна отримати деяку корисну інформацію – наприклад, легко визначити мінімальне та максимальне значення ознаки. Але не видно, як розподілено ознаку серед усієї сукупності обстежуваних студентів. Розіб'ємо варіанти на інтервали. Згідно з формулою Стерджеса, кількість інтервалів, що рекомендується

m= 1 +3,32l g(n)≈ 7,6, а величина інтервалу.

Діапазони отриманих інтервалів наведено у стовпці 1 таблиці.


Порахуємо, скільки значень ознаки потрапило до кожного інтервалу, і запишемо в стовпець 3.

Визначення 3.Число, що показує, скільки варіант потрапило в даний i інтервал, називається частотою і позначається n i .

Визначення 4.Відношення частоти до загального числа спостережень називається відносною частотою (w i) або вагою.

Визначення 5.Варіаційним рядом називається розташований у порядку зростання або спадання ряд варіантів з відповідними вагами.

Для цього прикладу варіантами є середини інтервалів.

Визначення 6.Накопиченою частотою( )називається число варіант зі значенням ознаки меншим, ніж х (хR).

ВИПАДКОВІ ВЕЛИЧИНИ І ЗАКОНИ ЇХ РОЗПОДІЛУ.

Випадковийназивають таку величину, яка набуває значення залежно від збігу випадкових обставин. Розрізняють дискретні та випадкові безперервні величини.

Дискретноюназивають величину, якщо вона приймає лічильну множину значень. ( Приклад:кількість пацієнтів на прийомі у лікаря, число літер на сторінці, число молекул у заданому обсязі).

Безперервнийназивають величину, яка може набувати значення всередині деякого інтервалу. ( Приклад:температура повітря, маса тіла, зростання людини тощо)

Законом розподілувипадкової величини називається сукупність можливих значень цієї величини і, що відповідають цим значенням, ймовірностей (або частот народження).

П р і м е р:

x x 1 x 2 x 3 x 4 ... x n
p р 1 р 2 р 3 р 4 ... p n
x x 1 x 2 x 3 x 4 ... x n
m m 1 m 2 m 3 m 4 ... m n

ЧИСЛОВІ ХАРАКТЕРИСТИКИ ВИПАДКОВИХ ВЕЛИЧИН.

У багатьох випадках поряд із розподілом випадкової величини або замість нього інформацію про ці величини можуть дати числові параметри, що отримали назву числових характеристик випадкової величини . Найбільш уживані з них:

1 .Математичне очікування - (Середнє значення) випадкової величини є сума творів всіх можливих її значень на ймовірності цих значень:

2 .Дисперсія випадкової величини:


3 .Середнє квадратичне відхилення :

Правило "ТРОХ СИГМ" -якщо випадкова величина розподілена за нормальним законом, то відхилення цієї величини від середнього значення по абсолютній величині не перевищує потрійного середнього квадратичного відхилення

ЗАОН ГАУССА – НОРМАЛЬНИЙ ЗАКОН РОЗПОДІЛУ

Часто зустрічаються величини, розподілені за нормальному закону (Закон Гауса). Головна особливість : він є граничним законом, до якого наближаються інші закони розподілу

Випадкова величина розподілена за нормальним законом, якщо її щільність імовірності має вигляд:



M(X)- Математичне очікування випадкової величини;

s- Середнє квадратичне відхилення.

Щільність ймовірності(функція розподілу) показує, як змінюється ймовірність, віднесена до інтервалу dx випадкової величини, залежно від значення самої величини:


ОСНОВНІ ПОНЯТТЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ

Математична статистика- Розділ прикладної математики, що безпосередньо примикає до теорії ймовірностей. Основна відмінність математичної статистики від теорії ймовірностей полягає в тому, що в математичній статистиці розглядаються не події над законами розподілу та числовими характеристиками випадкових величин, а наближені методи відшукання цих законів та числових характеристик за результатами експериментів.

Основними поняттямиматематичної статистики є:

1. Генеральна сукупність;

2. вибірка;

3. варіаційний ряд;

4. мода;

5. медіана;

6. процентиль,

7. полігон частот,

8. гістограма.

Генеральна сукупність- велика статистична сукупність, з якої відбирається частина об'єктів на дослідження

(Приклад:все населення області, студенти вузів цього міста тощо)

Вибірка (вибіркова сукупність)- безліч об'єктів, відібраних із генеральної сукупності.

Варіаційний ряд- Статистичне розподіл, що складається з варіант (значень випадкової величини) та відповідних їм частот.

Приклад:

X, кг
m

x- значення випадкової величини (маса дівчаток віком 10 років);

m- Частота народження.

Мода- Значення випадкової величини, якому відповідає найбільша частота народження. (У наведеному вище прикладі моді відповідає значення 24 кг, воно зустрічається частіше за інших: m = 20).

Медіана- Значення випадкової величини, яке ділить розподіл навпіл: половина значень розташована правіше медіани, половина (не більше) - лівіше.

Приклад:

1, 1, 1, 1, 1. 1, 2, 2, 2, 3 , 3, 4, 4, 5, 5, 5, 5, 6, 6, 7 , 7, 7, 7, 7, 7, 8, 8, 8, 8, 8 , 8, 9, 9, 9, 10, 10, 10, 10, 10, 10

У прикладі спостерігаємо 40 значень випадкової величини. Всі значення розташовані в порядку зростання з урахуванням частоти їхнього народження. Видно, що праворуч від виділеного значення 7 розташовані 20 (половина) із 40 значень. Отже, 7 – це медіана.

Для характеристики розкиду знайдемо значення, не вище за які виявилося 25 і 75% результатів вимірювання. Ці величини називаються 25-м та 75-м відсотками . Якщо медіана ділить розподіл навпіл, то 25-й та 75-й відсотки відсікають від нього по четвертушці. (Саму медіану, до речі, можна вважати 50-м відсотком.) Як видно з прикладу, 25-й і 75-й відсотки рівні відповідно 3 і 8.

Використовують дискретне (точковий) статистичний розподіл та безперервне (інтервальний) статистичний розподіл.

Для наочності статистичні розподіли зображують графічно як полігону частот або - гістограми .

Полігон частот- ламана лінія, відрізки якої з'єднують точки з координатами ( x 1 ,m 1), (x 2 ,m 2), ..., або для полігону відносних частот - З координатами ( x 1, р * 1), (x 2, р * 2), ... (Мал.1).


m m i /n f(x)

Рис.1 Рис.2

Гістограма частот- Сукупність суміжних прямокутників, побудованих на одній прямій лінії (Рис.2), основи прямокутників однакові і рівні dx , а висоти дорівнюють відношенню частоти до dx , або р * до dx (Щільність ймовірності).

Приклад:

х, кг 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4
m

Полігон частот

Відношення відносної частоти до ширини інтервалу має назву густини ймовірності f(x)=m i / n dx = p* i / dx

Приклад побудови гістограми .

Скористайтеся даними попереднього прикладу.

1. Розрахунок кількості класових інтервалів

де n - Число спостережень. У нашому випадку n = 100 . Отже:

2. Розрахунок ширини інтервалу :

,

3. Упорядкування інтервального ряду:

2.7-2.9 2.9-3.1 3.1-3.3 3.3-3.5 3.5-3.7 3.7-3.9 3.9-4.1 4.1-4.3 4.3-4.5
m
f(x) 0.3 0.75 1.25 0.85 0.55 0.6 0.4 0.25 0.05

Гістограма

1. Математична статистика. Вступ

Математична статистика – це така дисципліна, яка застосовується у всіх галузях наукового знання.

Статистичні методи призначені розуміння "чисельної природи" дійсності (Nisbett, et al., 1987).

Визначення поняття

Математична статистика - це розділ математики, присвячений методам аналізу даних, переважно імовірнісної природи. Вона займається систематизацією, обробкою та використаннямстатистичних даних для теоретичних та практтичних висновків.

Статистичними даними називаються відомості про кількість об'єктів у будь-якій більш менш широкої сукупності, що володіють тими або іншими ознаками. Тут важливо зрозуміти, що статистика має справу саме з кількістю об'єктів, а не з їх описовими ознаками.

Мета статистичного аналізу – дослідження властивостей випадкової величини. Для цього доводиться кілька разів вимірювати значення випадкової величини, що вивчається. Отримана група значень сприймається як вибірказ гіпотетичної генеральної сукупності.

Проводиться статистична обробка вибірки, і після цього приймається рішення. Важливо зауважити, що внаслідок початкової умови невизначеності ухвалене рішення завжди має характер "нечіткого висловлювання". Іншими словами, у статистичній обробці доводиться мати справу з ймовірностями, а не з точними твердженнями.

Головне у статистичному методі - це підрахунок кількості об'єктів, що входять до різних груп. Об'єкти збираються в групу за певною загальною ознакою, а потім розглядається розподіл цих об'єктів у групі за кількісним виразом даної ознаки. У статистиці найчастіше застосовується вибірковий метод аналізу, тобто. аналізується не вся група об'єктів, а невелика вибірка – кілька об'єктів, взятих із великої групи. Широко використовується теорія ймовірностей при статистичній оцінці спостережень та для формування висновків.

Основним предметом математичної статистики є обчислення статистик (Нехай простить нас читач за тавтологію), є критеріями для оцінки достовірності апріорних припущень, гіпотез або висновків по суті емпіричних даних.

Інше визначення - "Статистики - це приписи, за якими з вибірки розраховується деяке число - значення статистики для даної вибірки"[Закс, 1976]. Вибіркові середнє та дисперсія, відношення дисперсій двох вибірок або будь-які інші функції від вибірки можуть розглядатисяяк статистики.

Обчислення "статистик" - це уявлення "одним числом" складного стохастичного (імовірнісного) процесу.

Розподіл Стьюдента

Статистики також є випадковими змінними. Розподіл статистик (тест-розподілу) лежать в основі критеріїв, які побудовані на цій статистиці. Наприклад, В. Госсет, працюючи на броварні Гіннеса і публікуючись під псевдонімом "Стьюдент", в 1908 р. довів дуже корисні властивості розподілу відносини різниці між вибірковим середнім та середнім значенням генеральної сукупності () до стандартної помилки середнього значення генеральної сукупності, або t -статистики ( розподіл Стьюдента ):

. (5.7)

Розподіл Стьюдента формою за певних умов наближається до нормальному.

Іншими двома важливими розподілами вибіркових статистик єc 2 -розподілі F -розподіл, що широко використовуються в ряді розділів статистики для перевірки статистичних гіпотез.

Отже, предметматематичної статистики складає формальна кількіснасторона об'єктів, що досліджуються, байдужа до специфічної природи самих досліджуваних об'єктів.

З цієї причини в прикладах тут йдеться про групи даних, про числа, а не про конкретні вимірювані речі. І тому за зразками розрахунків, даних тут, ви можете розраховувати свої дані, отримані на різних об'єктах.

Головне - підібрати відповідний для ваших даних метод статистичної обробки.

Залежно від конкретних результатів спостережень математична статистика поділяється кілька розділів.

Розділи математичної статистики

        Статистика чисел.

        Багатовимірний статистичний аналіз.

        Аналіз функцій (процесів) та часових рядів.

        Статистика об'єктів нечислової природи.

У сучасній науці вважається, що будь-яка область досліджень не може бути справжньою наукою доти, доки в неї не проникне математика. У цьому сенсі математична статистика є повноважним представником математики у будь-якій іншій науці та забезпечує науковий підхід до досліджень. Можна сміливо сказати, що науковий підхід починається там, де у дослідженні з'являється математична статистика. Ось чому математична статистика така важлива для будь-якого сучасного дослідника.

Хочете бути справжнім сучасним дослідником – вивчайте та застосовуйте у своїй роботі математичну статистику!

Статистика з необхідністю з'являється там, де відбувається перехід від одиничного спостереження до множини. Якщо у вас є безліч спостережень, вимірів та даних – то без математичної статистики вам не обійтися.

Математичну статистику поділяють натеоретичну та прикладну.

Теоретична статистика доводить науковість та правильність самої статистики.

Теоретична математична статистика - наука, що вивчає методирозкриття закономірностей, властивих великим сукупностям однорідних об'єктів, виходячи з їх вибіркового обстеження.

Цим розділом статистики займаються математики, і вони люблять з допомогою своїх теоретичних математичних доказів переконувати нас у цьому, що статистика як така наукова і можна довіряти. Біда в тому, що ці докази здатні зрозуміти лише інші математики, а звичайним людям, яким потрібно користуватися математичною статистикою, ці докази все одно не доступні, та й зовсім не потрібні!

Висновок: Якщо ви не математик, то не витрачайте даремно своїх сил на розуміння теоретичних викладок з приводу математичної статистики. Вивчайте власне статистичні методи, а чи не їх математичні обгрунтування.

Прикладна статистика вчить користувачів працювати з будь-якими даними та отримувати узагальнені результати. Неважливо, які саме ці дані, важливо, яка кількість цих даних знаходиться у вашому розпорядженні. Крім того, прикладна статистика підкаже нам, наскільки можна вірити, що отримані результати відображають дійсний стан справ.

Для різних дисциплін прикладної статистики використовують різні набори конкретних методів. Тому розрізняють такі розділи прикладної статистики: біологічна, психологічна, економічна та інші. Вони відрізняються один від одного комплектацією прикладів та прийомів, а також улюбленими методами обчислень.

Можна навести наступний приклад різниці між застосуванням прикладної статистики для різних дисциплін. Так, статистичне вивчення режиму турбулентних водних потоків провадиться на основі теорії стаціонарних випадкових процесів. Однак застосування тієї ж теорії до аналізу економічних часових рядів може призвести до грубих помилок через те, що припущення того, що розподіл ймовірностей зберігається незмінним у цьому випадку, як правило, цілком неприйнятний. Отже, цих різних дисциплін знадобляться різні статистичні методи.

Отже, математичну статистику має застосовувати у своїх дослідженнях будь-який сучасний вчений. Навіть той учений, який працює у напрямках, які дуже далекі від математики. І він повинен вміти застосовувати прикладну статискіку до своїх даних, навіть не знаючи її.

© Сазонов В.Ф., 2009.

«Деякі люди думають, що вони завжди мають рацію. Такі люди не могли б ні бути хорошими вченими, ні мати якийсь інтерес до статистики… Випадок був з неба спущений на землю, де він став частиною світу науки». (Дайменд С.)

«Випадок – лише міра нашого невігластва. Випадковими явищами, якщо їм дати визначення, будуть ті, законів яких ми не знаємо». (А. Пуанкаре «Наука та гіпотеза»)

«Слава нагоди. Хіба не випадок
З незмінним завжди нарівні.
Випадок часто подією править,
Породжує і радість, і біль.
І завдання перед нами життя ставить:
Як осягнути випадковості роль»
(З книги Б.А. Кордемського "Математика вивчає випадковості")

Сам світ закономірний - так ми часто рахуємо і вивчаємо закони фізики, хімії і т.д., і все ж ніщо не відбувається без втручання випадковості, що виникає під впливом непостійних, побічних причинних зв'язків, що змінюють перебіг явища або досвіду при його повторенні. Створюється «ефект випадковості» із властивою закономірністю «прихованої обумовленості», тобто. у випадковості виникає необхідність закономірного результату.

Математики випадкові події розглядають лише у дилемі «бути чи не бути» - настане чи не настане.

Визначення.Розділ прикладної математики, у якому досліджуються кількісні характеристики масових випадкових подій чи явищ, називається математичною статистикою.

Визначення.Поєднання елементів теорії ймовірностей та математичної статистики називають стохастикою.

Визначення. Стохастика- це той розділ математики, який виник та розвивається у тісному зв'язку з практичною діяльністю людини. Сьогодні елементи стохастики входять до математики для всіх, стають новим, важливим аспектом математичної та загальної освіти.

Визначення. Математична статистика– наука про математичні методи систематизації, обробки та використання статистичних даних для наукових та практичних висновків.

Поговоримо про це докладніше.

Загальноприйнятою зараз є думка на математичну статистику як у науку про загальні методи обробки результатів експерименту. Вирішуючи ці проблеми, яким повинен мати експеримент, щоб зроблені на його підставі судження були правильними. Математична статистика частково стає наукою планування експерименту.

Значення слова "статистика" за останні два століття зазнало значних змін, - пишуть відомі сучасні вчені Ходжес і Леман, - слово "статистика" має один корінь зі словом "держава" (state) і спочатку означало мистецтво та науку управління: перші викладачі статистики університетів Німеччини 18 століття сьогодні називалися б фахівцями з суспільних наук. Оскільки рішення уряду певною мірою ґрунтуються на даних про населення, промисловість тощо. Статистики, природно, стали цікавитися і такими даними, і поступово слово «статистика» стало означати збір даних про населення, про державу, а потім взагалі збирання та обробку даних. Немає сенсу отримувати дані, якщо з цього не витягується якась користь, і статистики, природно, починають займатися інтерпретацією даних.

Сучасний статистик вивчає методи, з яких можна зробити висновки про популяцію з урахуванням даних, які зазвичай отримують з вибірки «популяції».

Визначення. Статистик– людина, яка займається наукою про математичні методи систематизації, обробки та використання статистичних даних для наукових та практичних висновків.

Математична статистика виникла у 17 столітті та розвивалася паралельно з теорією ймовірностей. Подальший розвиток математичної статистики (друга половина 19 початок 20-их століть) має насамперед, П.Л. Чебишеву, А.А. Маркову, А.М. Ляпунову, До. Гауссу, А. Кетле, Ф.Гальтону, До Пірсону, та інших. У 20-му найбільш істотний внесок у математичну статистику було зроблено А.Н. Колмогоровим, В.І. Романовським, Є.Є. Слуцьким, Н.В. Смирновим, Б.В. Гнеденко, а також англійськими Ст'юдентом, Р. Фішером, Е. Пурсоном та американськими (Ю. Нейман, А Вальд) вченими.

Завдання математичної статистики та значення помилки у світі науки

Встановлення закономірностей, яким підпорядковані масові випадкові явища, ґрунтуються на вивченні методами теорії ймовірностей статистичних даних результатів спостережень.

Перше завдання математичної статистики – вказати способи збирання та угруповання статистичних відомостей, отриманих в результаті спостережень або в результаті спеціально поставлених експериментів.

Друге завдання математичної статистики – розробити методи аналізу статистичних даних, залежно від цілей дослідження.

Сучасна математична статистика розробляє методи визначення кількості необхідних випробувань на початок дослідження (планування експерименту), під час дослідження (послідовний аналіз). Її можна визначити як науку про прийняття рішень за умови невизначеності.

Коротко, можна сказати, завдання математичної статистики полягає у створенні методів збирання та обробки статистичних даних.

При вивченні масового випадкового явища передбачається, що це випробування виробляються за однакових умов, тобто. група основних факторів, що піддаються обліку (вимірюванню) і істотно впливають на результат випробування, зберігає по можливості однакові значення.

Випадкові фактори спотворюють результат, який вийшов би за наявності лише основних факторів, роблять його випадковим. Відхилення результату кожного випробування від істинного називається помилкою спостереження, яка є випадковою величиною. Необхідно розрізняти систематичні помилки та випадкові.

Науковий експеримент немислимий без помилки, як океан, без солі. Будь-який потік фактів, що поповнює наше знання, приносить якусь помилку. Згідно з відомою приказкою в житті у більшості людей ні в чому не можна бути впевненим, крім смерті та податків, а вчений додає: "І помилок досвіду".

Статистик - це "шукайка", яка полює за помилкою. Статистика інструмент для виявлення помилки.

Слово “помилка” означає простий “прорахунок”. Наслідки прорахунку – це невелике та порівняно нецікаве джерело помилки експерименту.

Справді, наші інструменти ламаються; наші очі та вуха можуть обдурити нас; наші виміри ніколи не бувають абсолютно точними, іноді навіть наші арифметичні підрахунки є помилковими. Помилка експерименту є чимось суттєвішим, ніж неточна рулетка або обман зору. І оскільки найважливіша справа статистики допомогти вченим проаналізувати помилку експерименту, ми повинні спробувати зрозуміти, що таке помилка насправді.

Над якою б проблемою вчений не працював, вона, безумовно, виявиться складнішою, ніж йому хотілося б. Припустимо, він вимірює випадання радіоактивних опадів у різних широтах. Результати залежатимуть від висоти над рівнем моря тих місць, де зібрані зразки, кількості місцевих опадів і від висотних циклонів на ширших просторах.

Експериментальна помилка - це невід'ємна частина будь-якого наукового досвіду.

Один і той же результат може бути помилкою та інформацією залежно від проблеми та погляду. Якщо біолог хоче досліджувати, як зміна у харчуванні впливають зростання, то наявність спорідненої конституції є джерелом помилки; якщо ж він вивчає залежність між спадковістю та зростанням, джерелом помилки будуть відмінності у харчуванні. Якщо фізик хоче досліджувати залежність між електропровідністю та температурою, відмінності в щільності, що є провідником матеріалу, є джерелом помилки; якщо він вивчає залежність між цією щільністю і електропровідністю, температурні зміни будуть джерелом помилки.

Це вживання слова помилка може здатися сумнівним, і, можливо, переважним було б сказати, що отримані ефекти спотворені “непередбачуваними” або “небажаними” впливами. Ми плануємо експеримент вивчення відомих впливів, але випадкові чинники, які ми можемо передбачити чи проаналізувати, спотворюють результати, додаючи до них свої власні ефекти.

Відмінності між запланованими ефектами та ефектами, зумовленими випадковими причинами, подібно до різниці між рухами судна в морі, що пливе за певним курсом, і судна, що дрейфує безцільно по волі мінливих вітрів і течій. Рух другого судна можна назвати випадковим рухом. Не виключено, що це судно може прийти в якийсь порт, але більш ймовірно, що воно, ні в яке певне місце не прийде.

Статистики використовують слово “випадковий” для позначення явища, результат якого у момент часу неможливо передбачити.

Помилка, обумовлена ​​передбаченими в досвіді ефектами, іноді буває швидше систематичною, ніж випадковою.

Систематична помилка вводить в оману більше, ніж випадкова. Перешкоди, що йдуть від іншої радіостанції, можуть створити систематичний музичний акомпанемент, який іноді можна передбачити, якщо ви знаєте мелодію. Але цей “акомпанемент” може бути причиною того, що ми можемо скласти неправильне судження про слова або музику програми, яку ми намагаємося почути.

Проте виявлення систематичної помилки часто наводить нас слід нового відкриття. Знання, як з'являються випадкові помилки, допомагають нам виявити систематичні помилки і, отже, виключити їх.

Той самий характер міркувань звичайний і в наших життєвих справах. Як часто ми помічаємо: "Це не випадковість!" Щоразу, коли ми можемо це сказати – ми знаходимося на шляху до відкриття.

Наприклад, А.Л. Чижевський, аналізуючи історичні процеси: збільшення смертності, епідемії, початку війн, великі переміщення народів, різкі зміни клімату тощо. відкрив залежність між цими, не пов'язаними між собою процесами та періодами сонячної активності, які мають цикли: 11 років, 33 роки.

Визначення. Під систематичною помилкоюрозуміється помилка, що повторюється і однакова всім випробувань. Вона зазвичай пов'язані з неправильним веденням експерименту.

Визначення. Під випадковими помилкамирозуміються помилки, що виникають під впливом випадкових факторів і змінюються випадковим чином досвіду до досвіду.

Зазвичай розподіл випадкових помилок симетрично щодо нуля, звідки випливає важливий висновок: за відсутності систематичних помилок справжній результат випробувань є математичне очікування випадкової величини, конкретне значення якої фіксується у кожному випробуванні.

Об'єктами вивчення математичної статистики може бути якісні чи кількісні ознаки досліджуваного явища чи процесу.

У разі якісної ознаки підраховується кількість появи цієї ознаки в аналізованій серії дослідів; це число і є досліджуваною (дискретною) випадковою величиною. Прикладами якісних ознак можуть бути дефекти на готової деталі, демографічні дані тощо. Якщо ознака є кількісним, то досвіді проводиться пряме чи опосередковане виміру шляхом порівняння з деяким еталоном - одиницею виміру – з допомогою різних вимірювальних приладів. Наприклад, якщо є партія деталей, то якісною ознакою може бути стандартність деталі, а кількісним – контрольований розмір деталі.

Основні визначення

Значна частина математичної статистики пов'язані з необхідністю описати велику сукупність об'єктів.

Визначення.Усю сукупність об'єктів, що підлягають вивченню, називають генеральною сукупністю.

Генеральною сукупністю може бути все населення, місячна продукція заводу, населення риб, що у даному водоймі тощо.

Але генеральна сукупність – це не просто безліч. Якщо цікава для нас сукупність об'єктів занадто численна, або об'єкти важкодоступні, або є інші причини, що не дозволяють вивчити всі об'єкти, вдаються до вивчення якоїсь частини об'єктів.

Визначення.Та частина об'єктів, яка потрапила на перевірку, дослідження тощо, називається вибірковою сукупністюабо просто вибіркою.

Визначення.Число елементів у генеральній сукупності та вибірці називається їх обсягами.

Як домогтися, щоб вибірка якнайкраще представляло ціле, тобто. була б репрезентативною?

Якщо ціле, тобто. якщо генеральна сукупність нам мало відома чи зовсім невідома, не вдається запропонувати нічого кращого, ніж суто випадковий вибір. Велика обізнаність дозволяє діяти краще, але все одно на деякій стадії настає незнання і, як наслідок – випадковий вибір.

Але як здійснити суто випадковий вибір? Як правило, відбір йде за ознаками, що легко спостерігаються, заради вивчення якого ведеться дослідження.

Порушення принципів випадкового вибору призводило до серйозних помилок. Стало знаменитим своєю невдачею опитування, проведене американським журналом “Літературний огляд” щодо результату президентських виборів 1936 року. Кандидатами цих виборах були Ф.Д. Рузвельт та А.М. Лондон.

Хто переміг?

Як генеральна сукупність редакція використовувала телефонні книги. Відібравши випадково 4 мільйони адрес, вона розіслала листівки з питаннями щодо ставлення до кандидатів у президенти по всій країні. Витративши велику суму на розсилки та обробку листівок, журнал оголосив, що на майбутніх виборах у президенти з великою перевагою переможе Ландон. Результат виборів виявився протилежним до цього прогнозу.

Тут були досконалі одразу дві помилки. По-перше, телефонні книги не дають репрезентативну вибірку із населення США – переважно заможні глави сімейств. По-друге, надіслали відповіді не всі люди, а у значній частині представники ділового світу, які й підтримували Ландона.

У той самий час соціологи Дж. Геллан і Еге. Уорнер правильно передбачили перемогу Ф.Д. Рузвельта, ґрунтуючись лише на чотирьох тисячах анкетах. Причиною цього було не тільки правильне складання вибірки. Вони врахували, що суспільство розпадається на соціальні групи, які є одноріднішими щодо кандидатів у президенти. Тому вибірка з шару може бути відносно нечисленною з тим самим результатом точності. Переміг у результаті Рузвельт, який був прихильником реформ для менш багатих верств населення.

Маючи результати обстеження за шарами, можна характеризувати суспільство загалом.

Що є вибірки?

Це ряди чисел.

Докладніше зупинимося на основних поняттях, що характеризують низку вибірки.

З генеральної сукупності вилучено вибірку обсягом n > n 1 , де n 1 - стільки разів спостерігалося поява x 1 , n 2 - x 2 і т.д.

Спостерігаються значення х i називають варіантами, а послідовність варіантів, записаних у порядку, що зростає - варіаційним рядом. Числа спостережень n i називають частотами та n i /n - відносними частотами (або частотами).

Визначення.Різні значення випадкової величини називаються варіантами.

Визначення. Варіаційним рядомназивається ряд, розташований у порядку зростання (або убування) варіантів з відповідними частотами (частинами).

Під час вивчення варіаційних рядів поруч із поняттями частоти використовується поняття накопиченої частоти. Накопичені частоти (частини) кожного інтервалу знаходяться послідовним підсумовуванням частот всіх попередніх інтервалів.

Визначення.Накопичення частот чи частостей називають кумуляцією. Кумулювати можна частоти варіант та інтервалів.

Характеристики ряду можуть бути кількісні та якісні.

Кількісні (варіаційні) характеристики- Це показники, які можна виразити числами. Їх поділяються на дискретні та безперервні.

Якісні (атрибутивні) характеристики– це показники, які виражаються числами.

Безперервні змінні- Це змінні, які виражаються дійсними числами.

Дискретні змінні– це змінні, які виражаються лише цілими числами.

Вибірки характеризуються центральними тенденціями: середнім значенням, модою та медіаною. Середнім значенням вибірки називають середнє арифметичне всіх її значень. Мода вибірки – ті її значення, що зустрічаються найчастіше. Медіана вибірки - це число, що "розділяє" навпіл упорядковану сукупність всіх значень вибірки.

Варіаційний ряд може бути дискретним чи безперервним.

Завдання

Дана вибірка: 1,3; 1,8; 1,2; 3,0; 2,1; 5; 2,4; 1,2; 3,2; 1,2; 4; 2.4.

Це низка варіантів. Розташувавши ці варіанти у порядку, ми отримаємо варіаційний ряд: 1,2; 1,2; 1,2; 1,3; 1,8; 2,1; 2,4; 2,4; 3,0; 3,2; 4; 5.

Середнє значення цього ряду дорівнює 2,4.

Медіана низки 2,25.

Мода ряду -1,2.

Дамо визначення цим поняттям.

Визначення. Медіаною варіаційного рядуназивається значення випадкової величини, яке припадає на середину варіаційного ряду (Ме).

Медіаною впорядкованого ряду чисел з непарним числом членів називається число, записане посередині, а медіаною впорядкованого ряду чисел із парним числом членів називається середнє арифметичне двох чисел, записаних посередині. Медіаною довільного ряду чисел називається медіана відповідного впорядкованого ряду.

Визначення. Модою варіаційного рядуназивають варіант (значення випадкової величини), якому відповідає максимальна частота (Мо), тобто. яка зустрічається найчастіше.

Визначення. Середньоарифметичним значенням варіаційного рядуназивається результат розподілу суми значень статистичної змінної на число цих значень, тобто на кількість доданків.

Правило знаходження середньоарифметичного значення вибірки:

  1. кожну варіанту помножити її частоту (кратность);
  2. скласти усі отримані твори;
  3. поділити знайдену суму у сумі всіх частот.

Визначення. Розмахом рядуназивається різницю між R=x max -x min , тобто. найбільшим та найменшим значеннями цих варіантів.

Перевіримо, чи правильно ми знайшли середнє значення цього ряду, медіану та моду, спираючись на визначення.

Порахували число членів, їх 12 - парне число членів, отже треба знайти середнє арифметичне двох чисел записаних посередині, тобто 6 і 7 варіанти. (2,1 +2,4) \ 2 = 2.25 - медіана.

Мода. Модою є 1.2 т.к. лише це число зустрічається 3 рази, інші зустрічаються менше, ніж 3 разу.

Середньоарифметичне значення знаходимо так:

(1,2*3+1,3+1,8+2,1+2,4*2+3,0+3,2 +4+5)\12=2,4

Складемо таблицю

Такі таблиці називають частотними. Вони числа другого рядка – частоти; вони показують, як часто зустрічаються у вибірці ті чи інші її значення.

Визначення. Відносною частотоюзначень вибірки називають відношення її частоти до всіх значень вибірки.

Відносні частоти інакше називають частостями. Частоти та частоти називають вагами. Знайдемо розмах низки: R=5-1,2=3,8; Розмах ряду дорівнює 3,8.

Інформація до роздумів

Середнє арифметичне – це умовна величина. Насправді вона не існує. Реально є загальна сума. Тому середнє арифметичне немає характеристика одного спостереження; вона характеризує ряд загалом.

Середнє значенняможна трактувати як центр розсіювання значень ознаки, що спостерігається, тобто. значення, біля якого коливаються всі спостерігаються значення, причому алгебраїчна сума відхилень від середнього, завжди дорівнює нулю, тобто. сума відхилень від середнього у більшу чи меншу сторону рівні між собою.

Середнє арифметичнеє абстрактною (узагальнюючою) величиною. Навіть за завдання ряду лише з натуральних чисел, середнє значення може виражатися дробовим числом. приклад: середній бал контрольної роботи 3,81.

Середнє значенняперебуває як для однорідних величин. Середня врожайність зернових по всій країні (кукурудза-50-60 ц. з га. та гречка-по5-6 ц. з га, жито, пшениця тощо), середнє споживання продуктів харчування, середня величина національного доходу на душу населення , Середній показник забезпеченості житлом, середній зважений показник вартості житла, середня трудомісткість будівництва будівлі і т.д. – це показники держави як єдиної народногосподарської системи, це звані системні середні.

У статистиці широке застосування знаходять такі характеристики, як мода та медіана. Їх називають структурними середніми, т.к. Значення цих показників визначаються загальної структурою низки даних.

Іноді ряд може мати дві моди, іноді ряд може мати моди.

Модає найбільш прийнятним показником при виявленні розфасовки деякого товару, якому віддають перевагу покупці; ціни товар цього виду, поширений над ринком; як розмір взуття, одягу, який має найбільший попит; вид спорту, яким воліють займатися більшість населення країни, міста, селища школи тощо.

У будівництві існує 8 варіантів плит по ширині, і частіше застосовуються 3 види: 1 м. 1,2 м. і 1,5 м. По довжині 33 варіанти плит, але частіше за інших застосовуються плити довжиною 4,8 м.; 5,7 м. та 6,0 м., мода на плити найчастіше зустрічається серед цих 3-х розмірів. Аналогічно можна міркувати і з марками вікон.

Моду низки даних знаходять тоді, коли хочуть виявити певний типовий показник.

Мода може бути виражена числом та словами, з погляду статистики мода – це екстремум частоти.

Медіанадозволяє враховувати інформацію про ряд даних, яку дає середнє арифметичне та навпаки.

Математична статистика одна із основних розділів такий науки, як математика, і є галузь, вивчаючу методи і правила обробки певних даних. Іншими словами, вона досліджує способи розкриття закономірностей, які властиві великим сукупностям однакових об'єктів, ґрунтуючись на їхньому вибірковому обстеженні.

Завдання даного розділу полягає у побудові методів оцінки ймовірності чи прийнятті певного рішення про характер подій, що розвиваються, спираючись на отримані результати. Для опису даних використовуються таблиці, діаграми та кореляційні поля. застосовуються рідко.

Математична статистика використовують у різних галузях науки. Наприклад, для економіки важливо обробляти відомості про однорідні сукупності явищ та об'єктів. Ними можуть бути вироби, що випускаються промисловістю, персонал, дані про прибуток і т. д. Залежно від математичної природи результатів спостережень, можна виділити статистику чисел, аналіз функцій та об'єктів нечислової природи, багатовимірний аналіз. Крім цього, розглядають загальні та приватні (пов'язані з відновленням залежностей, використанням класифікацій, вибірковими дослідженнями) завдання.

Автори деяких підручників вважають, що теорія математичної статистики є лише розділом теорії ймовірності, інші – що це самостійна наука, що має власні цілі, завдання та методи. Однак у будь-якому випадку її використання дуже широке.

Так, найяскравіше математична статистика застосовна у психології. Її використання дозволить фахівцеві правильно обґрунтувати знайти залежність між даними, узагальнити їх, уникнути багатьох логічних помилок та багато іншого. Слід зазначити, що виміряти той чи інший психологічний феномен чи властивість особистості без обчислювальних процедур часто просто неможливо. Це свідчить, що ази цієї науки необхідні. Іншими словами, її можна назвати джерелом та базою теорії ймовірностей.

p align="justify"> Метод дослідження, який спирається на розгляд статистичних даних, використовується і в інших областях. Однак відразу слід зазначити, що його риси щодо об'єктів, що мають різну природу походження, завжди своєрідні. Тому об'єднувати в одну науку фізичну чи немає сенсу. Загальні ж риси даного методу зводяться до підрахунку певної кількості об'єктів, що входять до тієї чи іншої групи, а також до вивчення розподілу кількісних ознак та застосування теорії ймовірностей для отримання тих чи інших висновків.

Елементи математичної статистики використовуються в таких галузях, як фізика, астрономія і т. д. Тут можуть розглядатися значення характеристик та параметрів, гіпотези про збіг будь-яких характеристик у двох вибірках, про симетрію розподілу та багато іншого.

Велику роль математична статистика грає у проведенні Їх метою найчастіше є побудова адекватних методів оцінювання та перевірка гіпотез. Нині велике значення у цій науці мають комп'ютерні технології. Вони дозволяють як значно спростити процес розрахунку, а й створити для розмноження вибірок чи щодо придатності отриманих результатів практично.

У загальному випадку методи математичної статистики допомагають зробити два висновки: або прийняти судження про характер або властивості досліджуваних даних та їх взаємозв'язків, або довести, що отриманих результатів недостатньо для того, щоб робити висновки.