Чи хотіли ви спробувати інший інструмент, який допомагає писати тексти, відповідати на питання або генерувати ідеї, але не знали, з чого почати?
Альтернативи ChatGPT – це різні сервіси, що також надають функції текстового асистента і можуть виконувати схожі завдання.
Поки ChatGPT і нова мовна модель GPT-4 від компанії OpenAI переможно крокували світом, дивуючи спеціалістів своїми неймовірними можливостями, їхні конкуренти не гаяли часу дарма. Свої аналоги ChatGPT вже розробили й IT-гіганти, і невеликі стартапи.
У цій статті ми познайомимо вас із альтернативними чат-ботами, заснованими на оригінальних нейромережевих моделях. Вивчимо можливості та характеристики кожного аналога, опишемо переваги та недоліки. У нашій невеликій добірці – найкращі творіння вчених зі США.
Bard від Google
11 травня 2023 року Google відкрив користувачам зі 180 країн (Україна серед них є) доступ до чат-бота Bard, заснованого на власній мовній моделі PaLM 2. Щоправда, запустити його вдалося лише з другої спроби.
Під час першої презентації Bard припустився прикрої фактичної помилки у відповіді, що викликало шквал критики в ЗМІ. Утім, аналогічні фейли ChatGPT, які він робить постійно, не завадили йому досягти успіху. Досить швидко Google представив «поліпшену версію», в якій, за твердженнями розробників, були виправлені всі виявлені баги.
Що вміє Bard?
Bard – це універсальний чат-бот, який може і бесіду на будь-які теми підтримувати, і програмний код за текстовим описом генерувати. Крім тексту Bard також може працювати з мультимодальними запитами, що містять зображення.
Одна з кілер-фіч Bard – інтеграція з пошуковими сервісами Google. Бот може правильно відповідати на запитання, що стосуються актуальних подій, а також додавати до відповідей посилання на джерела.
У цьому Bard схожий на Bing Chat, заснований на тандемі GPT-4 c пошуковиком від Microsoft. Аналогічна функція в ChatGPT реалізується за допомогою плагінів і поки доступна в обмеженому режимі.
На жаль, Bard слабо знає іноземні мови. Спочатку він міг розуміти тільки англійську, а пізніше в нього додали підтримку японської та корейської. Google обіцяє навчити ШІ якісно спілкуватися ще 40 мовами, але з цим поки щось не ладиться.
Що у Bard під капотом
«Мозком» Bard служить нейромережа PaLM 2 – мовна модель Google, заснована на архітектурі Transformer.
Перша мережа PaLM містила 540 мільярдів параметрів. За цим показником вона втричі перевершувала модель GPT-3.5, на якій працює базова версія ChatGPT. Google вже успішно використовував PaLM для вирішення різних завдань, включно з управлінням роботами.
Про PaLM 2 відомо набагато менше, ніж про її попередницю. Google взяв приклад з OpenAI, яка засекретила свою нову модель GPT-4, і також не збирається розкривати характеристики нейромережі.
Кількість параметрів PaLM 2 невідома – розробники лише повідомляють, що «PaLM 2 менша за PaLM, але більш ефективна». Поліпшення характеристик нейронної мережі досягається не за рахунок розміру, а за рахунок архітектури, методів навчання і більш різноманітних датасетів.
Claude від Anthropic
Група колишніх співробітників OpenAI заснувала 2021 року незалежний стартап під назвою Anthropic. Компанія зуміла залучити інвестиції на сотні мільйонів доларів, левову частку яких вклав Google – основний суперник OpenAI і Microsoft у сфері впровадження ботів зі ШІ.
Anthropic представила власного чат-бота Claude, здатного конкурувати з ChatGPT. За заявами творців, бот «рідше видає токсичні відповіді» завдяки методу навчання під назвою конституційний ШІ (constitutional AI), що ґрунтується на наборі правил («конституції»).
Що вміє Claude
Компанія Anthropic пропонує користувачам дві версії програми: Claude Instant і Claude. Версія Instant працює швидше і коштує менше, ніж Claude, але частіше помиляється, через що виглядає менш «розумною».
За мультимодальними можливостями Claude у будь-якій доступній версії поступається основним конкурентам. Наразі бот може сприймати тільки текст.
Розробники заявляють, що Claude розуміє тексти англійською. Підтримка інших мов офіційно не заявлена. Однак нам вдалося поговорити з Claude українською.
Крім простої балаканини, Claude також здатний на програмування. Чат-бот підтримує генерацію за текстовим описом коду на HTML + CSS, Python, JavaScript, а також SQL-запитів. При спробі створити код на старому-доброму Pascal або на інших менш популярних мовах, Claude відмовився зробити це, заявивши, що в нього «немає таких знань або навичок».
Навчальний датасет Claude, відповідно до дисклеймера Anthropic, містить дані, зібрані до весни 2021 року. Тому бот, подібно до ChatGPT, не може видавати достовірні твердження про події останніх двох років. Наші спроби вивідати у Claude будь-яку інформацію про свіжі новини не увінчалися успіхом.
Можливість виходу в інтернет для пошуку актуальної інформації у бота Anthropic поки не передбачена. Також у Claude немає плагінів, подібних до плагінів ChatGPT, які могли б додати програмі низку додаткових функцій.
Зате Claude значно перевершує всіх наявних конкурентів за розміром контекстного вікна. Версія Claude 100K здатна сприйняти 100 000 токенів (це приблизно 75 000 англійських слів). Для порівняння, найпросунутіша модель від OpenAI GPT-4-32k, вбудована в ChatGPT, може утримувати в пам’яті втричі менше слів.
Завдяки гігантському контекстному вікну Claude під час одного з демонстраційних прогонів «прочитав» увесь текст «Великого Гетсбі» за 22 секунди і зміг правильно відповісти на запитання, які стосуються тексту культового роману Фіцджеральда.
При цьому варто зазначити, що настільки вражаюча фіча недоступна користувачам у спрощеній версії бота. Звичайний Claude Instant може за один раз обробляти лише 9000 токенів (приблизно 7000 слів), що відповідає здібностям конкурентів.
Що у Claude під капотом
Чат-бот базується на закритій моделі Anthropic-LM. Інформації про нейромережу небагато. Відомо, що одна з її версій містить 52 мільярди параметрів (утричі менше, ніж у першої версії ChatGPT).
Мабуть, спрощений варіант бота Claude Instant працює на ще більш компактній моделі. Результати порівняння показників роботи Anthropic-LM з іншими популярними нейромережами можна подивитися в дослідженні інженерів Стенфордського університету.
Родзинкою Anthropic-LM є оригінальний метод навчання, заснований на зводі правил, який у компанії гордо назвали «конституцією». Фахівці детально описали підхід у препринті, опублікованому в грудні 2022 року.
На відміну від методу навчання RLHF (ми писали про нього в цій статті), в основі навчання за «конституцією» лежить ранжування відповідей штучним інтелектом, а не людьми-експертами. Вчені Anthropic зазначають, що ШІ може замінити роботу експертів у 90% випадків. Таким чином, для навчання Claude потрібно залучати меншу кількість співробітників.
Крім економії на зарплаті, метод дає змогу уникнути включення в логіку роботи нейромережі стереотипів і упереджень, характерних для людей, які беруть участь у навчанні. Частину тренувальних зразків і підказок розробники виклали на GitHub.
Завдяки тому, що Claude доступний за API, його широко впроваджують у різні сервіси чат-ботів та інтелектуальних послуг. Наприклад, на рішенні від Anthropic працює служба швидких підказок DuckAssist в інтернет-пошуковику DuckDuckGo, а також платформа чат-ботів Poe.
Підіб’ємо підсумки
Лідером серед аналогів ChatGPT, найімовірніше, стане Bard за рахунок масової інтеграції з популярними сервісами Google.
Розробка Anthropic – справжня «робоча конячка». Шляхом масового використання в різних сервісах і платформах чат-ботів отримати доступ до Claude дуже просто.
Серед явних переваг Claude – рекордне контекстне вікно на 100 000 токенів, але фіча доступна тільки в «просунутій» версії. З іншого боку, бот Anthropic, на відміну від конкурентів, поки що може працювати тільки з текстом.








