OpenAI впервые за пять лет выпустила открытые ИИ-модели

Forklog
2025-08-06 08:55:12

Компания OpenAI выпустила рассуждающие ИИ-модели с открытым исходным кодом. Они демонстрируют высокие показатели в ряде бенчмарков и доступны для загрузки на Hugging Face. We released two open-weight reasoning models—gpt-oss-120b and gpt-oss-20b—under an Apache 2.0 license.Developed with open-source community feedback, these models deliver meaningful advancements in both reasoning capabilities & safety.https://t.co/PdKHqDqCPf— OpenAI (@OpenAI) August 5, 2025 Представлено две версии: более крупная и производительная gpt-oss-120b — способна работать на одном GPU Nvidia; облегченная версия gpt-oss-20b — может работать на ноутбуке с 16 ГБ памяти. Релиз знаменует собой выпуск первых языковых моделей OpenAI с открытым исходным кодом с момента запуска GPT-2, которую представили более пяти лет назад — в 2019 году. Компания отметила, что ее открытые модели могут обращаться к более мощным закрытым LLM, если не справляются с задачей самостоятельно. В начале своей работы OpenAI публиковала исходный код нейросетей, но позже перешла к закрытому формату разработки. Это позволило компании создать крупный бизнес, продавая доступ к продуктам через API. В январе Сэм Альтман признал, что компания оказалась «не на той стороне истории» в вопросе открытого исходного кода. Сегодня она сталкивается с растущим давлением со стороны китайских лабораторий вроде DeepSeek, Alibaba и Moonshot AI, которые разработали несколько способных и открытых моделей. В июле администрация президента США Дональда Трампа призвала американских разработчиков искусственного интеллекта активнее раскрывать технологии для содействия их глобальному внедрению с опорой на американские ценности. Тесты, бенчмарки, цифры В тесте по программированию Codeforces gpt-oss-120b и gpt-oss-20b набрали 2622 и 2516 баллов соответственно. Они опередили R1 от DeepSeek, но не дотянули до o3 и o4-mini. Источник: OpenAI. В Humanity Last Exam — сложном испытании с разными вопросами по различным предметам — модели набрали 19% и 17,3% соответственно. Аналогично предыдущему тесту, они уступили o3, но обошли ведущие открытые модели DeepSeek и Qwen. Источник: OpenAI. В математическом соревновании AIME открытые модели набрали 96,6 и 96 баллов соответственно, что сопоставимо с показателями других ИИ компании. Источник: OpenAI. Открытые нейросети галлюцинируют значительно чаще по сравнению с o3 и o4-mini. OpenAI отметила, что это «ожидаемо, так как маленькие модели имеют меньше знаний о мире». Gpt-oss-120b и gpt-oss-20b галлюцинировали в ответ на 49% и 53% вопросов PersonQA — внутреннего эталона для измерения точности знаний ИИ о людях. O1 имеет показатель 16%, o4-mini — 36%. https://forklog.com/news/ai/gallyutsinatsii-ostalis-osnovnoj-problemoj-ii Способ обучения OpenAI обучала новые открытые модели по тем же технологиям, что и закрытые. они Они основаны на архитектуре mixture-of-experts, позволяющей задействовать лишь часть параметров для каждого запроса. Так, gpt-oss-120, имеющая 117 млрд общих параметров, применяет 5,1 млрд на токен. Нейросети обучались с использованием высокопроизводительного обучения с подкреплением — этапа посттренинга, в рамках которого модели осваивают поведенческие шаблоны в симулированной среде. Для этого применялись крупные кластеры графических процессоров Nvidia. Этот процесс также использовался для обучения серии o. Открытые модели имеют схожую структуру цепочки размышлений, в которой требуется дополнительное время и вычислительные ресурсы для проработки ответов. OpenAI заявляет, что открытые модели хорошо подходят для ИИ-агентов: они могут вызывать инструменты вроде веб-поиска или выполнять код на Python в ходе рассуждений. Однако они работают только с текстом, то есть не могут обрабатывать или генерировать изображения и аудио. Не совсем прозрачно OpenAI выпустила gpt-oss-120b и gpt-oss-20b под лицензией Apache 2.0, которая позволяет предприятиям монетизировать открытые модели OpenAI без необходимости платить или получать разрешение от компании. Однако фирма не опубликовала обучающие данные, которые использовались для создания нейросетей. Решение неудивительно, учитывая несколько судебных процессов против ИИ-разработчиков за «неправомерное» использование информации для настройки искусственного интеллекта. OpenAI несколько раз откладывала выпуск открытых ИИ-моделей из соображений безопасности. Компания исследовала в том числе возможность использования gpt-oss для кибератак и создания оружия. Компания провела тестирования и заявила, что модель способна незначительно увеличить биологические возможности. Доступ к AWS С выходом открытых ИИ-моделей от OpenAI Amazon заявила, что они станут доступны на Amazon Web Services. Это первый случай, когда нейросети стартапа представлены на площадке. Microsoft также предлагает версии двух новых ИИ, оптимизированные для устройств на Windows. OpenAI — самая дорогая в мире Стартап OpenAI ведет переговоры с инвесторами о продаже акций. Предполагаемая оценка — $500 млрд. Это позволит ей обойти SpaceX Илона Маска и стать самой дорогой частной технологической компанией в мире, пишет Financial Times. На данный момент фирма находится на этапе закрытия последнего раунда финансирования с оценкой в $300 млрд. О нем стало известно в конце марта. https://forklog.com/news/ai/smi-openai-privlekla-8-3-mlrd-pri-otsenke-v-300-mlrd Однако параллельно уже ведутся переговоры с Thrive Capital и другими инвесторами касательно нового раунда. Если он будет закрыт, OpenAI обойдет SpaceX, недавно оцененную в $400 млрд. По информации издания, OpenAI изучает возможность вторичной продажи акций, которая позволит нынешним и бывшим сотрудникам продать ценные бумаги. Цена размещения пока не определена. Объем продажи будет зависеть от спроса инвесторов. Напомним, в июле OpenAI представила специальный режим обучения для студентов в ChatGPT, который помогает прорабатывать задачи поэтапно, а не просто получать готовый ответ.