Mercato
24h Vol
10071
Cryptocurrencies
58.26%
Bitcoin Condividere

OpenAI впервые за пять лет выпустила открытые ИИ-модели

OpenAI впервые за пять лет выпустила открытые ИИ-модели


Forklog
2025-08-06 08:55:12

Компания OpenAI выпустила рассуждающие ИИ-модели с открытым исходным кодом. Они демонстрируют высокие показатели в ряде бенчмарков и доступны для загрузки на Hugging Face. We released two open-weight reasoning models—gpt-oss-120b and gpt-oss-20b—under an Apache 2.0 license.Developed with open-source community feedback, these models deliver meaningful advancements in both reasoning capabilities & safety.https://t.co/PdKHqDqCPf— OpenAI (@OpenAI) August 5, 2025 Представлено две версии: более крупная и производительная gpt-oss-120b — способна работать на одном GPU Nvidia; облегченная версия gpt-oss-20b — может работать на ноутбуке с 16 ГБ памяти. Релиз знаменует собой выпуск первых языковых моделей OpenAI с открытым исходным кодом с момента запуска GPT-2, которую представили более пяти лет назад — в 2019 году. Компания отметила, что ее открытые модели могут обращаться к более мощным закрытым LLM, если не справляются с задачей самостоятельно. В начале своей работы OpenAI публиковала исходный код нейросетей, но позже перешла к закрытому формату разработки. Это позволило компании создать крупный бизнес, продавая доступ к продуктам через API. В январе Сэм Альтман признал, что компания оказалась «не на той стороне истории» в вопросе открытого исходного кода. Сегодня она сталкивается с растущим давлением со стороны китайских лабораторий вроде DeepSeek, Alibaba и Moonshot AI, которые разработали несколько способных и открытых моделей. В июле администрация президента США Дональда Трампа призвала американских разработчиков искусственного интеллекта активнее раскрывать технологии для содействия их глобальному внедрению с опорой на американские ценности. Тесты, бенчмарки, цифры В тесте по программированию Codeforces gpt-oss-120b и gpt-oss-20b набрали 2622 и 2516 баллов соответственно. Они опередили R1 от DeepSeek, но не дотянули до o3 и o4-mini. Источник: OpenAI. В Humanity Last Exam — сложном испытании с разными вопросами по различным предметам — модели набрали 19% и 17,3% соответственно. Аналогично предыдущему тесту, они уступили o3, но обошли ведущие открытые модели DeepSeek и Qwen. Источник: OpenAI. В математическом соревновании AIME открытые модели набрали 96,6 и 96 баллов соответственно, что сопоставимо с показателями других ИИ компании. Источник: OpenAI. Открытые нейросети галлюцинируют значительно чаще по сравнению с o3 и o4-mini. OpenAI отметила, что это «ожидаемо, так как маленькие модели имеют меньше знаний о мире». Gpt-oss-120b и gpt-oss-20b галлюцинировали в ответ на 49% и 53% вопросов PersonQA — внутреннего эталона для измерения точности знаний ИИ о людях. O1 имеет показатель 16%, o4-mini — 36%. https://forklog.com/news/ai/gallyutsinatsii-ostalis-osnovnoj-problemoj-ii Способ обучения OpenAI обучала новые открытые модели по тем же технологиям, что и закрытые. они Они основаны на архитектуре mixture-of-experts, позволяющей задействовать лишь часть параметров для каждого запроса. Так, gpt-oss-120, имеющая 117 млрд общих параметров, применяет 5,1 млрд на токен. Нейросети обучались с использованием высокопроизводительного обучения с подкреплением — этапа посттренинга, в рамках которого модели осваивают поведенческие шаблоны в симулированной среде. Для этого применялись крупные кластеры графических процессоров Nvidia. Этот процесс также использовался для обучения серии o. Открытые модели имеют схожую структуру цепочки размышлений, в которой требуется дополнительное время и вычислительные ресурсы для проработки ответов. OpenAI заявляет, что открытые модели хорошо подходят для ИИ-агентов: они могут вызывать инструменты вроде веб-поиска или выполнять код на Python в ходе рассуждений. Однако они работают только с текстом, то есть не могут обрабатывать или генерировать изображения и аудио. Не совсем прозрачно OpenAI выпустила gpt-oss-120b и gpt-oss-20b под лицензией Apache 2.0, которая позволяет предприятиям монетизировать открытые модели OpenAI без необходимости платить или получать разрешение от компании. Однако фирма не опубликовала обучающие данные, которые использовались для создания нейросетей. Решение неудивительно, учитывая несколько судебных процессов против ИИ-разработчиков за «неправомерное» использование информации для настройки искусственного интеллекта. OpenAI несколько раз откладывала выпуск открытых ИИ-моделей из соображений безопасности. Компания исследовала в том числе возможность использования gpt-oss для кибератак и создания оружия. Компания провела тестирования и заявила, что модель способна незначительно увеличить биологические возможности. Доступ к AWS С выходом открытых ИИ-моделей от OpenAI Amazon заявила, что они станут доступны на Amazon Web Services. Это первый случай, когда нейросети стартапа представлены на площадке. Microsoft также предлагает версии двух новых ИИ, оптимизированные для устройств на Windows. OpenAI — самая дорогая в мире Стартап OpenAI ведет переговоры с инвесторами о продаже акций. Предполагаемая оценка — $500 млрд. Это позволит ей обойти SpaceX Илона Маска и стать самой дорогой частной технологической компанией в мире, пишет Financial Times. На данный момент фирма находится на этапе закрытия последнего раунда финансирования с оценкой в $300 млрд. О нем стало известно в конце марта. https://forklog.com/news/ai/smi-openai-privlekla-8-3-mlrd-pri-otsenke-v-300-mlrd Однако параллельно уже ведутся переговоры с Thrive Capital и другими инвесторами касательно нового раунда. Если он будет закрыт, OpenAI обойдет SpaceX, недавно оцененную в $400 млрд. По информации издания, OpenAI изучает возможность вторичной продажи акций, которая позволит нынешним и бывшим сотрудникам продать ценные бумаги. Цена размещения пока не определена. Объем продажи будет зависеть от спроса инвесторов. Напомним, в июле OpenAI представила специальный режим обучения для студентов в ChatGPT, который помогает прорабатывать задачи поэтапно, а не просто получать готовый ответ.


Leggi la dichiarazione di non responsabilità : Tutti i contenuti forniti nel nostro sito Web, i siti con collegamento ipertestuale, le applicazioni associate, i forum, i blog, gli account dei social media e altre piattaforme ("Sito") sono solo per le vostre informazioni generali, procurati da fonti di terze parti. Non rilasciamo alcuna garanzia di alcun tipo in relazione al nostro contenuto, incluso ma non limitato a accuratezza e aggiornamento. Nessuna parte del contenuto che forniamo costituisce consulenza finanziaria, consulenza legale o qualsiasi altra forma di consulenza intesa per la vostra specifica dipendenza per qualsiasi scopo. Qualsiasi uso o affidamento sui nostri contenuti è esclusivamente a proprio rischio e discrezione. Devi condurre la tua ricerca, rivedere, analizzare e verificare i nostri contenuti prima di fare affidamento su di essi. Il trading è un'attività altamente rischiosa che può portare a perdite importanti, pertanto si prega di consultare il proprio consulente finanziario prima di prendere qualsiasi decisione. Nessun contenuto sul nostro sito è pensato per essere una sollecitazione o un'offerta