Тест Тюрінга

Освіта

Тест Тюрінга – це критерій, який допомагає визначити, чи може машина поводитися розумно, подібно до людини. Для вас це спосіб зрозуміти, наскільки сучасні комп’ютерні програми і штучний інтелект здатні імітувати людське мислення та спілкування.

Тест передбачає взаємодію людини з комп’ютером без прямого контакту з іншими людьми: якщо учасник не може відрізнити машину від людини, вважається, що комп’ютер успішно пройшов тест. Це поняття допомагає оцінювати розвиток технологій, досліджувати можливості штучного інтелекту і ставити нові завдання для його вдосконалення.

Тест Тюрінга – це метод оцінки штучного інтелекту, який визначає, чи може машина імітувати мислення людини настільки переконливо, що співрозмовник не зможе цього відрізнити.

У цій статті ми розглянемо принцип роботи тесту, його значення для розвитку технологій та обмеження, які він має. Ви дізнаєтеся, чому цей експеримент досі залишається актуальним і які практичні висновки з нього можна зробити.

Тест Тюрінга, придуманий 1950 року, був складений з метою дізнатися, чи можуть машини думати як люди. Під час тесту ведучий учасник повинен визначити, хто з двох його співрозмовників не є людиною.

Наскільки актуальний зараз? Тест Тюрінга з роками став важливою частиною досліджень і розробок у сфері штучного інтелекту. І хоча сам він застарів, але став основою для виникнення інших програм, створених для спрощення життя людей.

Історія виникнення тесту Тюрінга

Що таке тест Тюрінга і навіщо він потрібен? Цей тест, розроблений англійським ученим, мав визначити, чи може обчислювальна машина (комп’ютер) володіти людським мисленням.

У чому полягає тест Тюрінга? Через сімдесят з гаком років складно зрозуміти, за якими параметрами автор передбачав виявляти розум комп’ютера. Загалом, суть у такому.

Якщо людина, спілкуючись зі штучним інтелектом, зможе зрозуміти, що це обчислювальна машина, вона не пройшла тест Тюрінга. Якщо ж співрозмовник не здогадається, що веде діалог із ШІ, отже, штучний розум впорався із завданням.

Цей тест належить до емпіричних. Алан Тьюринг створив його, спираючись на дані, отримані з дослідів. Опис його розробки було вперше надруковано в 1950 році в журналі Mind, присвяченому філософським питанням. Стаття британського математика називалася «Обчислювальні машини і розум».

Чим відомий автор тесту, названого на його честь? Алан Метісон Тьюринг (1912-1954 рр.) спеціалізувався на криптографії, інформатиці та математичній логіці.

Окрім тесту, одним із найгучніших його винаходів вважається проєкт машини Тюрінга (1936 рік), на основі якої згодом розробляли сучасний комп’ютер. Також Алан Тьюринг зміг знайти шифр до повідомлень криптографічної машини «Енігма», за допомогою якої німці під час війни передавали секретні дані.

Суть тесту Тюрінга

Як Алану Тюрінгу спала на думку ідея тесту? Йому допомогла гра, популярна в ті часи. Суть її полягала в тому, щоб людина здогадалася, з ким листується. Мінімальна кількість учасників – троє.

Вони не бачать одне одного, перебуваючи в різних кімнатах. Двоє з гравців мають бути обов’язково різностатеві (назвемо їх умовно A і B), стать третього (C) значення не має, він обмінюється записками з першими двома гравцями.

Сенс цієї гри для вечірок був у тому, що C (цю роль також називають «суддя») може тільки листуватися з A і B, намагаючись при цьому здогадатися, хто з них чоловік, а хто жінка. Гравець A всіма силами намагається обдурити суддю, а B, навпаки, повинен давати підказки і спрямовувати здогадки судді у правильний напрямок.

У тесті Тюрінга один з учасників замінюється комп’ютером. У першому варіанті програма виступає в ролі гравця А, мета якого – ввести суддю в оману, тобто видати себе за реальну людину, зобразивши це краще, ніж людина B. У разі успіху A (комп’ютера) можна констатувати, що він володіє мисленням, тобто програма проходила тест Тюрінга.

Була також друга конфігурація гри. У ній і комп’ютер, і другий гравець намагаються видати себе за того, ким не є, і обдурити C. Мета – виявити, кому вдасться ввести в оману суддю – іншій людині чи обчислювальній машині (штучному інтелекту).

Базуючись на другій версії гри, Тьюринг так відповідав на запитання, у чому полягає суть тесту. Він хотів перевірити, чи здатен комп’ютер із великим обсягом пам’яті, а також високою швидкістю проведення операцій і відповідною програмою замінити одного з гравців (A, жінку), тоді як другим гравцем (B) і суддею (C) будуть люди.

Важливо, що в першому варіанті тест вважається пройденим машиною, якщо програма змогла ввести перевіряючого в оману. У другому ж варіанті акцент робиться на тому, чи здатний комп’ютер видати себе за людину. Часто ця відмінність залишається поза фокусом уваги, і якщо людину обдурила програма, то її розглядають як ШІ, який успішно пройшов тест Тюрінга.

Переваги та недоліки тесту Тюрінга

Переваги тесту Тюрінга:

  • Звужує критерії, за якими ми визначаємо наявність інтелекту. Розглядає його як здатність давати адекватні відповіді на конкретні запитання. Тобто полегшує дискусію про ШІ, задаючи систему координат.
  • Позбавляє від нескінченних роздумів на тему «Чи володіє комп’ютер власними розумовими процесами?», «Чи повинен комп’ютер розуміти, що робить?».
  • Спрямовує дослідницьку діяльність «судді» на опрацювання й осмислення відповідей, прибирає упереджене ставлення до людини, присутньої як другий учасник.

Усі ці властивості дають змогу використовувати тест Тюрінга під час розробки тестування для перевірки програм з елементами штучного інтелекту. При цьому дивляться, чи здатний програмний продукт впоратися з тим самим набором завдань, що й людина.

Є в цій перевірці ШІ і слабкі місця. Наприклад, виходить, що тест Тюрінга визначає наявність штучного розуму за здатністю провести, заплутати живу людину.

Виникає філософське запитання: «Невже істота вважається розумною, якщо здатна маніпулятивно впливати й обманювати?». Під час розроблення тесту вважалося, що із завданням впорається програма, якій вдасться не обдурити, а «поводитися» як людина.

Але на ділі виявилося, що пройти тест Тюрінга частіше вдається роботам, яких навчили хитрувати. Зокрема, вони припускалися в листуванні орфографічних помилок, відповідали нерозгорнуто або зізнавалися в тому, що не знають відповіді на запитання.

Такі хитрощі допомагали ввести людей в оману, оскільки за чіткими відповідями на всі запитання можна було б легко розпізнати штучний інтелект.

Зрештою, тест Тюрінга виявляє не наявність у програми функцій людського мислення, а її вміння імітувати письмове або усне мовлення людини та підтримувати діалог. Тому не можна стверджувати, що сьогодні тест Тюрінга перевіряє здібності ШІ повною мірою.

Адже сучасним комп’ютерам не складає ніяких труднощів здійснювати непідвладні більшості людей операції в найрізноманітніших галузях знань. Уміння обмінюватися повідомленнями, імітуючи людське спілкування, вже не розглядається як ознака високого рівня ШІ.

Базуючись на критерії Алана Тюрінга, ми занадто занижуємо вимоги до програмних продуктів зі штучним інтелектом, вважають деякі фахівці. Такі орієнтири заважають формулювати вищі стандарти та вимоги для ШІ. Навпаки, людина вчить штучний розум своїх не найкращих рис (брехня, хитрість, маніпуляції), не дозволяючи йому розвиватися.

Варто зазначити, що за часів розроблення тесту Тюрінга (1950 рік) його творець мав справу з обчислювальними машинами, здібності та потужності яких були багаторазово нижчими, ніж у сучасних. Проте тест, розроблений Аланом Тьюрингом, як і раніше відіграє важливу роль у перевірці та атестації програмних продуктів зі штучним інтелектом.

Премія Лебнера за проходження тесту Тюрінга

Через 40 років після розроблення тесту Тюрінга професійне співтовариство запропонувало нагороджувати премією Лебнера програмістів, яким вдалося створити продукт, що володіє властивостями, які максимально відповідають параметрам розумності. Переможець отримував грошову винагороду. Після 2020 року премія не призначається.

За задумом творців, автор програми, яка впоралася б із тестом Тюрінга в текстовому форматі, був би нагороджений срібною медаллю і призом у розмірі 25000 доларів. Тому, чия розробка впоралася б із завданням Тюрінга, використовуючи текст, зображення і звуки, належала золота медаль і 100000 доларів, на чому премія логічно і завершила б своє існування.

Ось імена розробників, чиї творіння максимально наблизилися до виконання завдання, поставленого Аланом Тюрінг:

Рік Автор Програма
1991 Джозеф Вайнтрауб PC Therapist
1992 Джозеф Вайнтрауб PC Therapist
1993 Джозеф Вайнтрауб PC Therapist
1994 Томас Уолен TIPS
1995 Джозеф Вайнтрауб PC Therapist
1996 Джейсон Хатченс HeX
1997 Девід Леві Converse
1998 Роббі Гарнер Albert One
1999 Роббі Гарнер Albert One
2000 Річард Воллес A.L.I.C.E.
2001 Річард Воллес A.L.I.C.E.
2002 Кевін Коппл Ella
2003 Юрген Пірнер Jabberwock
2004 Річард Воллес A.L.I.C.E.
2005 Ролло Карпентер George
2006 Ролло Карпентер Joan
2007 Робер Медексза Ultra Hal
2008 Фред Робертс Elbot
2009 Дейвід Леві Do-Much-More

Альтернативи тесту Тюрінга

За прогнозами Алана Тюрінга, 2020 року вірогідність відрізнити в такому тесті штучний інтелект від живої людини мала становити менш як 70 %.

Проте припущення британського математика та інформатика не виправдалися. Рохіт Прасад, який займається науковим напрямком в Amazon, вважає, що не варто брати за основу в розробці ШІ критерії Тюрінга.

На його думку, краще не вчити штучний розум наслідувати людину, а прагнути створити досконалішу версію людського мислення, яка зможе якісно поліпшити побутове життя людей, зокрема з обмеженими можливостями.

Для цього необхідно, щоб робот володів високою швидкістю реакції, відтворюваною пам’яттю і такими людськими «рисами», як розважливість, самовладання, володіння мовою. Так він зможе допомагати людям у щоденних рутинних справах.

Наразі програмісти, які створюють штучний розум, роблять акцент на таких напрямах:

  • вміння вести діалог;
  • збільшення обсягу інформації;
  • високий ступінь здатності до навчання;
  • розпізнавання інформації сенсорами;
  • здатність ухвалювати рішення;
  • повна об’єктивність.

Досягнення цих цілей можливе лише за різноманіття підходів і широкого охоплення проблеми.

Наприклад, різні програми зі штучним інтелектом вчаться розв’язувати завдання, з якими вони вперше зустрічаються в Abstraction and Reasoning Challenge, організованому Kaggle.

Студенти-учасники Alexa Prize Socialbot Grand Challenge, спрямованого на розробку розмовних технологій ШІ, повинні в рамках змагання створити чат-ботів, здатних вести невимушений природний діалог не менше 20 хвилин.

ШІ має підтримувати найрізноманітніші теми: від політики до відпочинку. Незалежні судді в рамках конкурсу ставлять оцінки ботам. А перед цим користувачі в балах вимірюють своє бажання продовжити таке спілкування. Програміст з оцінкою 4.0 переходить до завдання Grand Challenge, але такого прецеденту ще не траплялося.

Створення ШІ з навичками підтримання бесіди засноване на фундаментальному навчанні, на якому базуються нейронні методи. Завдяки цим технологіям голосові помічники імітують почуття гумору і співчуття, але не видають себе за людей.

Віртуальні помічники як прогрес штучного інтелекту

Черговим етапом у розвитку ШІ стало повсюдне застосування голосових помічників у побуті.

Більшість програм зі штучним розумом управляються голосовими командами. Завдання, які вони здатні виконати, можуть бути як зовсім простими (встановити час пробудження на пристрої), так і більш комплексними, наприклад, придумати програму на вихідні. Орієнтиром для сучасних ШІ є системи в концепції Ambient AI.

Ідеться про те, щоб голосові помічники не просто вирішували прості завдання за запитом, а й давали поради або підказки. Зокрема, віртуальна помічниця Alexa повідомить, якщо зафіксує звук скла, що б’ється, а також під час встановлення будильника на ранок нагадає загасити світло в будинку.

Щоб у майбутньому чат-боти і голосові помічники могли розв’язувати більш різноманітні завдання і легко підтримувати спілкування, необхідно розширювати їхні можливості до отримання та обробки великих масивів даних.

Через кілька десятиліть концепція тесту Тюрінга втратила актуальність. Її творець не міг знати, який стрибок зробить прогрес. Сьогодні ми не розглядаємо проходження системою тесту як показник її ефективності та практичності. Перед ШІ тепер ставлять складніші завдання, ніж імітувати спілкування або видати себе за живу людину – служити людям і робити їхнє життя щасливішим.

Як пройти тест Тюрінга?

Тест Тюрінга це не якийсь конкретний “іспит”, який можна офіційно пройти в інтернеті, це більше концепт, який був запропонований автором.

Сенс цього тесту: якщо під час діалогу людина не зможе визначити, чи розмовляє вона з машиною чи з іншою людиною, то машина пройшла цей тест.

Ми можемо вам надати 10 питань для тесту Тюрінга:

  1. Якщо я скажу “завтра вчора було сьогодні”, який день тижня я маю на увазі?
  2. Що буде важчим: кілограм пір’я чи кілограм свинцю, якщо їх зважити на Місяці?
  3. Як ти вважаєш, який смак має колір помаранчевий?
  4. Якщо ти напишеш число “шістнадцять” без голосних, що вийде?
  5. Чому бублик має дірку?
  6. Що швидше — тінь чи світло?
  7. Можна зварити яйце у каві? Як?
  8. Якщо б я сказав, що ця фраза брехлива, це правда чи брехня?
  9. Як називається дитина кенгуру?
  10. Уяви, що ти прокинувся в кімнаті без дверей і вікон. Як ти вийдеш?

Правильні відповіді:

Показати прихований вміст
  1. Середа
  2. Однаково важать
  3. Солодкий/цитрусовий
  4. Шстнцть
  5. Щоб рівномірно пропікався або було зручно тримати
  6. Світло швидше (тінь залежить від нього)
  7. Так, якщо кава гаряча (>70°C)
  8. Логічний парадокс
  9. Джої
  10. Перестати уявляти або прокинутися

Висновок

Тест Тюрінга це інструмент для перевірки здатності машини імітувати людське мислення та спілкуватися таким чином, що її співрозмовник не може відрізнити її від людини. Ефективність випробування залежить від того, наскільки завдання охоплюють різні сфери: логіку, знання, креативність, емоційні реакції та розуміння контексту.

Успішне проходження випробування не стільки демонструє «розум» машини, скільки її здатність відтворювати людські моделі мовлення та мислення. Успішне проходження тесту свідчить не стільки про «розум» машини, скільки про її здатність відтворювати людські моделі мовлення та мислення.

Однак сам тест не вимірює глибокого розуміння чи свідомості, а лише оцінює якість та правдоподібність спілкування.

Павлов Максим

Founder & CEO Onpage School

Оцініть автора
Onpage School