市值
24小时
10071
Cryptocurrencies
58.26%
Bitcoin 分享

OpenAI впервые за пять лет выпустила открытые ИИ-модели

OpenAI впервые за пять лет выпустила открытые ИИ-модели


Forklog
2025-08-06 08:55:12

Компания OpenAI выпустила рассуждающие ИИ-модели с открытым исходным кодом. Они демонстрируют высокие показатели в ряде бенчмарков и доступны для загрузки на Hugging Face. We released two open-weight reasoning models—gpt-oss-120b and gpt-oss-20b—under an Apache 2.0 license.Developed with open-source community feedback, these models deliver meaningful advancements in both reasoning capabilities & safety.https://t.co/PdKHqDqCPf— OpenAI (@OpenAI) August 5, 2025 Представлено две версии: более крупная и производительная gpt-oss-120b — способна работать на одном GPU Nvidia; облегченная версия gpt-oss-20b — может работать на ноутбуке с 16 ГБ памяти. Релиз знаменует собой выпуск первых языковых моделей OpenAI с открытым исходным кодом с момента запуска GPT-2, которую представили более пяти лет назад — в 2019 году. Компания отметила, что ее открытые модели могут обращаться к более мощным закрытым LLM, если не справляются с задачей самостоятельно. В начале своей работы OpenAI публиковала исходный код нейросетей, но позже перешла к закрытому формату разработки. Это позволило компании создать крупный бизнес, продавая доступ к продуктам через API. В январе Сэм Альтман признал, что компания оказалась «не на той стороне истории» в вопросе открытого исходного кода. Сегодня она сталкивается с растущим давлением со стороны китайских лабораторий вроде DeepSeek, Alibaba и Moonshot AI, которые разработали несколько способных и открытых моделей. В июле администрация президента США Дональда Трампа призвала американских разработчиков искусственного интеллекта активнее раскрывать технологии для содействия их глобальному внедрению с опорой на американские ценности. Тесты, бенчмарки, цифры В тесте по программированию Codeforces gpt-oss-120b и gpt-oss-20b набрали 2622 и 2516 баллов соответственно. Они опередили R1 от DeepSeek, но не дотянули до o3 и o4-mini. Источник: OpenAI. В Humanity Last Exam — сложном испытании с разными вопросами по различным предметам — модели набрали 19% и 17,3% соответственно. Аналогично предыдущему тесту, они уступили o3, но обошли ведущие открытые модели DeepSeek и Qwen. Источник: OpenAI. В математическом соревновании AIME открытые модели набрали 96,6 и 96 баллов соответственно, что сопоставимо с показателями других ИИ компании. Источник: OpenAI. Открытые нейросети галлюцинируют значительно чаще по сравнению с o3 и o4-mini. OpenAI отметила, что это «ожидаемо, так как маленькие модели имеют меньше знаний о мире». Gpt-oss-120b и gpt-oss-20b галлюцинировали в ответ на 49% и 53% вопросов PersonQA — внутреннего эталона для измерения точности знаний ИИ о людях. O1 имеет показатель 16%, o4-mini — 36%. https://forklog.com/news/ai/gallyutsinatsii-ostalis-osnovnoj-problemoj-ii Способ обучения OpenAI обучала новые открытые модели по тем же технологиям, что и закрытые. они Они основаны на архитектуре mixture-of-experts, позволяющей задействовать лишь часть параметров для каждого запроса. Так, gpt-oss-120, имеющая 117 млрд общих параметров, применяет 5,1 млрд на токен. Нейросети обучались с использованием высокопроизводительного обучения с подкреплением — этапа посттренинга, в рамках которого модели осваивают поведенческие шаблоны в симулированной среде. Для этого применялись крупные кластеры графических процессоров Nvidia. Этот процесс также использовался для обучения серии o. Открытые модели имеют схожую структуру цепочки размышлений, в которой требуется дополнительное время и вычислительные ресурсы для проработки ответов. OpenAI заявляет, что открытые модели хорошо подходят для ИИ-агентов: они могут вызывать инструменты вроде веб-поиска или выполнять код на Python в ходе рассуждений. Однако они работают только с текстом, то есть не могут обрабатывать или генерировать изображения и аудио. Не совсем прозрачно OpenAI выпустила gpt-oss-120b и gpt-oss-20b под лицензией Apache 2.0, которая позволяет предприятиям монетизировать открытые модели OpenAI без необходимости платить или получать разрешение от компании. Однако фирма не опубликовала обучающие данные, которые использовались для создания нейросетей. Решение неудивительно, учитывая несколько судебных процессов против ИИ-разработчиков за «неправомерное» использование информации для настройки искусственного интеллекта. OpenAI несколько раз откладывала выпуск открытых ИИ-моделей из соображений безопасности. Компания исследовала в том числе возможность использования gpt-oss для кибератак и создания оружия. Компания провела тестирования и заявила, что модель способна незначительно увеличить биологические возможности. Доступ к AWS С выходом открытых ИИ-моделей от OpenAI Amazon заявила, что они станут доступны на Amazon Web Services. Это первый случай, когда нейросети стартапа представлены на площадке. Microsoft также предлагает версии двух новых ИИ, оптимизированные для устройств на Windows. OpenAI — самая дорогая в мире Стартап OpenAI ведет переговоры с инвесторами о продаже акций. Предполагаемая оценка — $500 млрд. Это позволит ей обойти SpaceX Илона Маска и стать самой дорогой частной технологической компанией в мире, пишет Financial Times. На данный момент фирма находится на этапе закрытия последнего раунда финансирования с оценкой в $300 млрд. О нем стало известно в конце марта. https://forklog.com/news/ai/smi-openai-privlekla-8-3-mlrd-pri-otsenke-v-300-mlrd Однако параллельно уже ведутся переговоры с Thrive Capital и другими инвесторами касательно нового раунда. Если он будет закрыт, OpenAI обойдет SpaceX, недавно оцененную в $400 млрд. По информации издания, OpenAI изучает возможность вторичной продажи акций, которая позволит нынешним и бывшим сотрудникам продать ценные бумаги. Цена размещения пока не определена. Объем продажи будет зависеть от спроса инвесторов. Напомним, в июле OpenAI представила специальный режим обучения для студентов в ChatGPT, который помогает прорабатывать задачи поэтапно, а не просто получать готовый ответ.


阅读免责声明 : 此处提供的所有内容我们的网站,超链接网站,相关应用程序,论坛,博客,社交媒体帐户和其他平台(“网站”)仅供您提供一般信息,从第三方采购。 我们不对与我们的内容有任何形式的保证,包括但不限于准确性和更新性。 我们提供的内容中没有任何内容构成财务建议,法律建议或任何其他形式的建议,以满足您对任何目的的特定依赖。 任何使用或依赖我们的内容完全由您自行承担风险和自由裁量权。 在依赖它们之前,您应该进行自己的研究,审查,分析和验证我们的内容。 交易是一项高风险的活动,可能导致重大损失,因此请在做出任何决定之前咨询您的财务顾问。 我们网站上的任何内容均不构成招揽或要约