MAI-1: Нова 500-мільярдна ІІ-модель Microsoft для боротьби з ChatGPT
Корпорація Microsoft розробляє власну великомасштабну мовну модель МАI-1, здатну скласти конкуренцію ІІ-технологіям Google, Anthropic та OpenAI, незважаючи на інвестиції в останню.
Модель МАI-1
Нова розробка Microsoft
Компанія Microsoft веде роботу над створенням масштабної мовної моделі під назвою МАI- 1, яка потенційно стане серйозним конкурентом штучного інтелекту, розробленого Google, Anthropic та OpenAI. Це відбувається, незважаючи на те, що корпорація інвестувала $10 млрд в OpenAI – розробника ChatGPT та отримала пріоритетне право на використання їх продуктів.
Керівництво проектом
Згідно з даними видання The Information, розробку МАI-1 очолює Мустафа Сулейман - Колишній керівник відділу штучного інтелекту Google. Він обіймав посаду генерального директора стартапу Inflection, інтелектуальну власність якого було придбано Microsoft у березні за $650 млн. При цьому корпорація також залучила частину персоналу компанії.
Характеристики моделі
Незважаючи на те, що МАI-1 може базуватися на методах, розроблених у Inflection, Microsoft позиціонує даний продукт як абсолютно нову великомасштабну мовну модель. Згідно заяв двох співробітників компанії, модель містить 500 млрд параметрів, що значно перевищує попередні проекти Microsoft з відкритим вихідним кодом, такі як Phi-3. За кількістю параметрів МАI-1 наближається до GPT-4 від OpenAI, яка, за чутками, може похвалитися 1 трлн параметрів, значно випереджаючи конкурентні моделі Meta та Mistral із 70 млрд параметрів.
Подвійний підхід до ІІ
Розробка МАI-1 демонструє подвійний підхід Microsoft до штучного інтелекту : компанія зосереджена як на невеликих локальних мовних моделях, так і на більш сучасних великомасштабних моделях, що працюють у хмарі. Подібний підхід розглядає Apple. МАI-1 також свідчить про готовність Microsoft досліджувати штучний інтелект незалежно від OpenAI, технології якої лежать в основі генеративних функцій компанії, включаючи помічника Copilot, інтегрованого в Windows.
Навчання та призначення моделі
Точне призначення МАI-1 поки не визначено і залежатиме від її продуктивності. Для навчання моделі Microsoft виділила великий кластер серверів із графічними процесорами Nvidia та збирала навчальні дані з різних джерел, включаючи тексти, згенеровані GPT-4, та публічні дані з Інтернету. Очікується, що оголошення про МАI-1 може відбутися цього місяця на конференції для розробників Microsoft Build.
Глосарій
- Microsoft - транснаціональна компанія, виробник програмного забезпечення для різних обчислювальних пристроїв.
- Google - американська транснаціональна корпорація, одна з провідних компаній у галузі інформаційних технологій та Інтернету.
- Anthropic - компанія, що спеціалізується на розробці штучного інтелекту та просунутих мовних моделей.
- OpenAI - дослідницька компанія, що займається розробкою та просуванням штучного інтелекту.
- ChatGPT - популярний чат-бот, заснований на великій мовній моделі, розроблений OpenAI.
Посилання
Відповіді на питання
Що таке MAI-1 і для чого вона призначена?
Які технічні характеристики MAI-1?
Хто очолює розробку MAI-1?
Як MAI-1 пов'язана з OpenAI та іншими розробниками ІІ?
Які дані використовувалися для навчання MAI-1?
Хештеги
Збережи посилання на цю сторінку
Обговорення теми – MAI-1: Нова 500-мільярдна ІІ-модель Microsoft для боротьби з ChatGPT
Microsoft розробляє потужну мовну модель ІІ MAI-1 з 500 мільярдами параметрів, щоб скласти конкуренцію ChatGPT від OpenAI, яку корпорація інвестувала $10 млрд.
Останні коментарі
8 коментарів
Написати коментар
Ваша адреса електронної пошти не буде опублікована. Обов'язкові поля відмічені *
Kseniya
Щось цікаве відбувається у Microsoft! Схоже, вони готують конкурента для ChatGPT 🤔 І це модель з величезною кількістю параметрів – 500 мільярдів! Навіть більше, ніж у GPT-4 OpenAI 🤯
Hans
Так, Microsoft не жартує. Вони явно хочуть обігнати OpenAI у гонці за найкращі великі мовні моделі 💪 Цікаво, як вони планують використовувати цю MAI-1? Може, в якихось своїх продуктах на зразок Copilot?
Francois
Поки що незрозуміло, але Microsoft каже, що призначення MAI-1 залежатиме від її продуктивності. Думаю, вони просто хочуть створити потужну базу для майбутніх ІІ-рішень 🧠 І так, 500 млрд параметрів – це серйозно! У рази більше, ніж Phi-3.
Enzo
Я радий бачити таку конкуренцію між гігантами ІІ! 🙌 Це має призвести до прогресу в області великих мовних моделей. Може ми побачимо ще більш просунуті можливості, ніж у ChatGPT 😎
Zdzislaw
Не варто надто радіти заздалегідь 😒 Цим великим моделям потрібні величезні обчислювальні потужності та дані для навчання. Вони можуть виявитися надто ресурсомісткими та дорогими для масового використання.
Sophia
Зате, як мовиться в статті, Microsoft збирається піти подвійним шляхом: MAI-1 для хмари, а менші локальні моделі для пристроїв 💻 Так що у них, схоже, є стратегія для різних випадків.
Sergio
Цікаво, як вони вирішуватимуть питання етики та зміщень при навчанні таких великих моделей 🤔 Адже вже відомо, що ChatGPT іноді дає упереджені відповіді. При такому величезному обсязі даних цей ефект може посилитися 😕
Oksana
Думаю, Microsoft серйозно ставиться до етики ІІ, враховуючи їх 'Відповідальні принципи ІІ' 🧐 Але ви маєте рацію, це велика проблема для індустрії. У будь-якому випадку, я з нетерпінням чекаю анонсу MAI-1 на Build цього місяця! 🤩