Огляд основних компаній та організацій, що рухають революцію ШІ.
Ландшафт генеративного ШІ формується кількома великими організаціями, що змагаються за створення найздатніших моделей. Розуміння хто ці гравці, їх філософій та ключових продуктів є необхідним для орієнтації у швидко змінюваній екосистемі ШІ.
Конкурентна динаміка складна: деякі компанії як OpenAI та Anthropic фокусуються на закритих фронтирних моделях, тоді як Meta та Mistral відстоюють підхід відкритих ваг. Google DeepMind використовує масивну інфраструктуру, а китайські лабораторії як DeepSeek показали, що вражаючих результатів можна досягти з новаторськими архітектурами та підходами до навчання.
OpenAI
GPT-4, ChatGPT, DALL-E 3, Sora, моделі міркування o1/o3. Піонер поточної хвилі ШІ. Першими продемонстрували закони масштабування та вивели LLM у мейнстрім.
Anthropic
Сімейство Claude (Opus, Sonnet, Haiku). Підхід безпеки Constitutional AI. Заснований колишніми дослідниками OpenAI. Відомий довгими контекстними вікнами (200K токенів).
Google DeepMind
Gemini (Ultra/Pro/Flash/Nano), прорив AlphaFold у фолдінгу білків, масивна обчислювальна інфраструктура. Нативно мультимодальні моделі з найбільшими контекстними вікнами (1M+ токенів).
Meta AI
Відкрите сімейство моделей Llama (Llama 3, 3.1, 3.2). Фундаментальні дослідження FAIR. Чемпіон відкритого ШІ — будь-хто може завантажити, запустити та файн-тюнити їх моделі.
Mistral AI
Європейська ШІ-лабораторія (Париж). Моделі Mistral, Mixtral MoE. Підхід відкритих ваг. Довели, що менші європейські лабораторії можуть конкурувати з американськими гігантами.
xAI (Grok)
ШІ-лабораторія Ілона Маска. Моделі Grok з доступом до реальних даних X (Twitter). Фокус на зменшенні цензури та максимізації корисності.
Китайські лабораторії
DeepSeek (R1 модель міркувань, конкурує з o1), Alibaba (відкрите сімейство Qwen), Baidu (ERNIE), ByteDance (Doubao). Стрімко скорочують розрив із західними лабораторіями.
Спеціалізовані лабораторії
Stability AI (генерація зображень Stable Diffusion), Cohere (корпоративний NLP), AI21 (гібридна модель Jamba), Runway (генерація відео). Лідери у своїх доменах.
Дослідницькі інституції
Allen AI (повністю відкритий OLMo), EleutherAI (відкрита дослідницька спільнота), LAION (відкриті датасети). Просувають прозорі, відтворювані дослідження ШІ.
Фронтирна модельНайздатніші моделі ШІ на передньому краї продуктивності, зазвичай від великих лабораторій.
Відкриті вагиМоделі, де навчені ваги публічно доступні, що дозволяє будь-кому запускати їх локально.
Закритий кодМоделі, доступні лише через API, з вагами та деталями навчання як пропрієтарна інформація.
MoE (Mixture of Experts)Архітектура, де лише підмножина параметрів моделі активується на кожний вхід, дозволяючи більші моделі при меншій вартості обчислень.