Теорія ймовірностей

Теорія ймовірностей Блог

Чи замислювалися ви, як системи прогнозують погоду, визначають ризики або оцінюють точність моделі? Або як обчислюється шанс того, що алгоритм видасть правильний результат?

Теорія ймовірностей – це математична основа для аналізу випадкових подій і обчислення їхніх шансів.

Продовжуємо розбиратися з математичними концепціями, на яких тримається сучасне IT. Сьогодні поговоримо про теорію ймовірностей – розділ математики, який широко використовується в машинному навчанні, геймдеві, статистиці та науці про дані.

Що таке теорія ймовірностей

Теорія ймовірностей – це наука, яка вивчає світ випадковостей і намагається їх передбачити. Тут трапляються такі поняття, як «події» та «ймовірності», які, зі свого боку, мають свої властивості та операції – про них ми поговоримо трохи пізніше.

Найпростіше продемонструвати, як працює теорія ймовірностей, на прикладі підкидання монетки. У цьому випадку в нас є два варіанти: орел або решка, а отже, шанс випадання кожної зі сторін однаковий і становить 50%.

Але як переконатися, що це дійсно так? Наприклад, я можу підкинути монетку десять разів, і мені магічним чином дев’ять разів поспіль випаде орел і один раз решка. Чи означає це, що шанс випадання орла – 90%? Звісно, ні – і в цього є наукове пояснення.

Річ у тім, що теорія ймовірностей розглядає випадкові події в рамках нескінченності. Інакше кажучи, якщо ми будемо підкидати монетку нескінченну кількість разів, то шанси випадання орла або решки наближатимуться до 50%.

Така сама логіка працює і для інших випадкових явищ – наприклад, шанс випадання числа 5 на гральному кубику дорівнює 1 до 6, а ймовірність того, що блискавка вдарить в одне й те саме місце двічі – приблизно 1 до 500.

Теорія ймовірностей допомагає нам передбачати шанс виникнення різних подій, коли відповідь не така однозначна і на події впливає безліч чинників.

Основні поняття

Ми згадали слова «подія» та «ймовірність», але не розповіли, що вони взагалі означають у контексті теорії ймовірностей. Нумо розбиратися.

Події

Подія – це все, що може статися, коли ми здійснюємо якусь дію. Наприклад, якщо ми кидаємо монетку, то подія – це випадання орла або решки. Щоб позначати події, використовують великі літери латинського алфавіту. Наприклад, для орла можемо вибрати букву A, а для решки – B.

Існує багато різних видів і класифікацій подій, але в цій статті ми зупинимося на основних чотирьох:

  • Достовірні – ті, які точно відбудуться. Якщо кинути склянку на підлогу, то з імовірністю 100% вона полетить униз.
  • Неможливі – ті, які ніколи не відбудуться. Якщо кинути ту саму склянку на підлогу, то вона ніколи не полетить угору (мораль: не варто кидати склянки на підлогу, якщо, звісно, ви не на МКС).
  • Випадкові – ті, які можуть статися, а можуть і не статися. Наприклад, якщо ми кидаємо гральний кубик, то не можемо з упевненістю сказати, що випаде число 2.
  • Несумісні – ті, які виключають одне одного. Наприклад, під час підкидання монетки може випасти або орел, або решка – обидва одночасно вони випасти не можуть.

Якщо зібрати всі несумісні події разом, вони називатимуться повною групою подій. Це безліч подій, одна з яких обов’язково трапиться, якщо ми чинимо дію, а інші – не відбудуться ніколи. Наприклад, коли ми кидаємо гральний кубик, може випасти тільки одна зі сторін.

Імовірності

Імовірність – це число, яке позначає шанс виникнення події. Наприклад, імовірність виграшу в лотерею може становити 1 до 1 000 000.

Ми записували значення ймовірностей у відсотках і відношеннях, але математикам зручніше розташовувати їх у діапазоні від 0 до 1. Якщо ймовірність дорівнює 0, то подія ніколи не відбудеться, а якщо 1 – точно відбудеться. Усе, що посередині, – це випадкові події.

Найпростіший спосіб обчислити ймовірність – поділити число сприятливих подій на загальне число можливих подій. Наприклад, якщо всього в колоді 36 карт, а ми хочемо дістати короля пік, то ймовірність цієї події дорівнює 1/36, або 0,03. Якби нас влаштував будь-який із королів, то ймовірність дорівнювала б 4/36 – тобто 0,1.

До формул ми ще повернемося, а поки що зауважимо, що ймовірність – це не завжди точне передбачення, а лише оцінка шансу виникнення події. Як випливає із закону великих чисел, якщо шанс випадання орла і решки дорівнює 50%, це не означає, що вони випадатимуть по черзі.

Ще ймовірність може бути умовною – або залежати від іншої події. Наприклад, якщо ми хочемо витягнути будь-який туз із колоди карт, шанс дорівнює 4/36. Але якщо до цього хтось уже витягнув одного туза, то ймовірність дорівнюватиме 3/35. Це тому, що в колоді стало на одну карту менше і кількість сприятливих подій теж зменшилася.

З визначеннями закінчили – тепер дізнаймося, як подіями можна керувати.

Алгебра подій

Коли ми рахуємо ймовірності, нас може влаштовувати більш ніж один результат подій. Або інша ситуація – нам може бути важливо, щоб дві події виконувалися разом. У таких випадках на допомогу приходить алгебра подій. Розбираємося, які дії вона дає змогу здійснювати.

Дисклеймер: у цьому розділі ми не розглядаємо віднімання і доповнення подій, тому що вони досить складні для першого знайомства з теорією ймовірностей. Можливо, скоро ми випустимо про них окрему статтю.

Додавання (об’єднання) подій

Сума двох подій A + B – це складна подія, яка відбудеться, якщо трапиться або подія A, або подія B, або обидві одночасно.

Припустимо, ми хочемо обчислити ймовірність випадання на кубику сторони з числами 2 або 4. Позначимо подію «випадання сторони 2» як A, а подію «випадання сторони 4» як B. Оскільки у кубика всього шість граней, ймовірність випадання кожної з цих сторін дорівнює 1/6.

А оскільки нас цікавить або подія A, або подія B, ми шукаємо суму цих подій – A + B. Обчислюємо відповідні ймовірності:

Виходить, що шанс випадання сторони 2 або 4 під час кидка кубика дорівнює 2 до 6, або 1 до 3, або 33%.

Правило додавання можна застосовувати не тільки до двох подій, а й до будь-якої їхньої кількості. Наприклад, подія A + B + C + D відбудеться, якщо трапиться хоча б одна з подій A, B, C, D або одна з їхніх комбінацій, така як A і C або A, C і D.

Множення (перетин) подій

Добуток подій A і B – це подія A × B, яка відбудеться, якщо трапиться і подія A, і подія B.

Припустимо, ми кидаємо монетку двічі і хочемо зрозуміти, який шанс, що обидва рази випаде решка. Нагадаємо, що ймовірність випадання решки – 1/2.

Позначаємо події: A – решка випадає перший раз, B – решка випадає вдруге. Рахуємо ймовірності:

Отримуємо, що шанс випадання решки двічі поспіль – 25%.

Як у випадку із сумою, добуток подій можна рахувати для будь-якої кількості різних подій. Давайте продовжимо приклад із монеткою – тепер ми хочемо, щоб вона випала чотири рази поспіль.

Додаємо два нових позначення: C – решка випадає втретє, D – решка випадає вчетверте. Імовірності все ті самі, рахуємо їхній добуток:

Відповідь – шанс випадання решки чотири рази поспіль дорівнює 1 до 16, або 6,25%.

Додавання сумісних подій

Коли ми говорили про додавання ймовірностей, ми використовували несумісні події, оскільки під час кидка кубика може випасти тільки один бік (або ребро, якщо вам дуже пощастить).

Тепер, коли ми пізнали тонкощі ймовірнісного множення, можна розібратися з тим, як складати сумісні події. У цьому випадку із суми двох подій потрібно просто відняти їхній добуток. Формула має такий вигляд:

P (A + B) = P (A) + P (B) – P (A ⋅ B)

Прикладом такого додавання може бути вибір випадкових чисел. Припустимо, у нас є набір чисел від 1 до 10 і ми хочемо знайти ймовірність того, що обране число буде або непарним, або ділитися на 7 без залишку.

Рахуємо ймовірності:

  • Подія A – число непарне. Імовірність вибрати саме його – 5/10.
  • Подія B – число ділиться на 7 без залишку. Імовірність – 1/10.

Оскільки число 7 задовольняє обом умовам, ми маємо справу із сумісними подіями – тобто вони можуть відбуватися одночасно. Підключаємо формулу: спочатку знаходимо суму ймовірностей, а потім віднімаємо з неї ймовірність перетину.

Вуаля! Виходить, що шанс виконання однієї з двох подій дорівнює 11/20, або 55%.

На цьому з алгеброю подій закінчимо і перейдемо до більш класичних формул. Але не лякайтеся, ми все детально пояснимо.

Формули теорії ймовірностей

Розберемося, що означають усі ці літери:

P(A) = n\m

  • Функція P обчислює ймовірність того, що відбудеться подія, яка нас влаштовує (A);
  • m позначає загальне число можливих подій;
  • n – число сприятливих результатів.

З цієї формули можна зробити кілька висновків:

  • Якщо ймовірність дорівнює одиниці – значить, вона достовірна. Сенс у тому, що із загального числа подій нам підходять усі – тобто подія точно відбудеться.
  • Якщо ймовірність дорівнює нулю – значить, вона неможлива. Усе через те, що нам не підходить жодна з наявних подій.
  • Якщо ймовірність перебуває в діапазоні від нуля до одиниці – вона випадкова. Це означає, що загальне число результатів більше нуля, але не всі з них нам підходять.
  • Тепер ви знаєте достатньо, щоб розв’язувати прості задачі з теорії ймовірностей, чим ми і займемося в наступному розділі.

Теорія ймовірностей в IT

Тепер, коли ми розібралися з основами, давайте подивимося, де саме використовується теорія ймовірностей у сучасних технологіях.

Машинне навчання побудовано на фундаменті ймовірностей. Алгоритми постійно працюють з оцінками вірогідності різних подій. Коли система розпізнавання зображень аналізує фотографію, вона може сказати: “З імовірністю 85% це кіт, з імовірністю 15% – собака”.

Рекомендаційні системи онлайн-магазинів обчислюють ймовірність того, що користувач купить певний товар. А алгоритми обробки природної мови передбачають наступне слово в реченні, базуючись на ймовірностях появи різних варіантів.

У геймдеві теорія ймовірностей визначає багато аспектів ігрового досвіду. Розробники використовують її для налаштування шансів випадання рідкісних предметів, створення непередбачуваної поведінки штучного інтелекту, генерації випадкових рівнів та балансування ігрових механік. Саме завдяки правильному розрахунку ймовірностей гравці отримують захоплюючий досвід без фрустрації від надто складних або надто легких викликів.

Кібербезпека неможлива без аналізу ймовірностей. Системи безпеки використовують статистичні методи для виявлення аномальної поведінки в мережі, оцінки ризиків потенційних кібератак та прогнозування загроз. Алгоритми аналізують шкідливе програмне забезпечення, обчислюючи ймовірність того, що певний файл може бути вірусом або трояном.

Аналітика великих даних повністю спирається на теорію ймовірностей. Компанії використовують статистичні методи для прогнозування попиту на товари, проведення A/B тестувань веб-сайтів, аналізу поведінки користувачів та оцінки ефективності рекламних кампаній. Без розуміння ймовірностей неможливо витягти цінну інформацію з величезних масивів даних.

Висновок

Теорія ймовірностей  допомагає нам приймати обґрунтовані рішення в умовах невизначеності. Від прогнозування погоди до рекомендацій фільмів на Netflix – усюди працюють принципи, які ми сьогодні розглядали.

Незалежно від того, чи ви розробляєте веб-додатки, аналізуєте дані, створюєте ігри або працюєте з штучним інтелектом – знання ймовірностей допоможе вам краще розуміти, як працюють сучасні технології.

Павлов Максим

Founder & CEO Onpage School

Оцініть автора
Onpage School