시가 총액
24시간 볼륨
10071
암호화폐
58.26%
Bitcoin 공유

OpenAI впервые за пять лет выпустила открытые ИИ-модели

OpenAI впервые за пять лет выпустила открытые ИИ-модели


Forklog
2025-08-06 08:55:12

Компания OpenAI выпустила рассуждающие ИИ-модели с открытым исходным кодом. Они демонстрируют высокие показатели в ряде бенчмарков и доступны для загрузки на Hugging Face. We released two open-weight reasoning models—gpt-oss-120b and gpt-oss-20b—under an Apache 2.0 license.Developed with open-source community feedback, these models deliver meaningful advancements in both reasoning capabilities & safety.https://t.co/PdKHqDqCPf— OpenAI (@OpenAI) August 5, 2025 Представлено две версии: более крупная и производительная gpt-oss-120b — способна работать на одном GPU Nvidia; облегченная версия gpt-oss-20b — может работать на ноутбуке с 16 ГБ памяти. Релиз знаменует собой выпуск первых языковых моделей OpenAI с открытым исходным кодом с момента запуска GPT-2, которую представили более пяти лет назад — в 2019 году. Компания отметила, что ее открытые модели могут обращаться к более мощным закрытым LLM, если не справляются с задачей самостоятельно. В начале своей работы OpenAI публиковала исходный код нейросетей, но позже перешла к закрытому формату разработки. Это позволило компании создать крупный бизнес, продавая доступ к продуктам через API. В январе Сэм Альтман признал, что компания оказалась «не на той стороне истории» в вопросе открытого исходного кода. Сегодня она сталкивается с растущим давлением со стороны китайских лабораторий вроде DeepSeek, Alibaba и Moonshot AI, которые разработали несколько способных и открытых моделей. В июле администрация президента США Дональда Трампа призвала американских разработчиков искусственного интеллекта активнее раскрывать технологии для содействия их глобальному внедрению с опорой на американские ценности. Тесты, бенчмарки, цифры В тесте по программированию Codeforces gpt-oss-120b и gpt-oss-20b набрали 2622 и 2516 баллов соответственно. Они опередили R1 от DeepSeek, но не дотянули до o3 и o4-mini. Источник: OpenAI. В Humanity Last Exam — сложном испытании с разными вопросами по различным предметам — модели набрали 19% и 17,3% соответственно. Аналогично предыдущему тесту, они уступили o3, но обошли ведущие открытые модели DeepSeek и Qwen. Источник: OpenAI. В математическом соревновании AIME открытые модели набрали 96,6 и 96 баллов соответственно, что сопоставимо с показателями других ИИ компании. Источник: OpenAI. Открытые нейросети галлюцинируют значительно чаще по сравнению с o3 и o4-mini. OpenAI отметила, что это «ожидаемо, так как маленькие модели имеют меньше знаний о мире». Gpt-oss-120b и gpt-oss-20b галлюцинировали в ответ на 49% и 53% вопросов PersonQA — внутреннего эталона для измерения точности знаний ИИ о людях. O1 имеет показатель 16%, o4-mini — 36%. https://forklog.com/news/ai/gallyutsinatsii-ostalis-osnovnoj-problemoj-ii Способ обучения OpenAI обучала новые открытые модели по тем же технологиям, что и закрытые. они Они основаны на архитектуре mixture-of-experts, позволяющей задействовать лишь часть параметров для каждого запроса. Так, gpt-oss-120, имеющая 117 млрд общих параметров, применяет 5,1 млрд на токен. Нейросети обучались с использованием высокопроизводительного обучения с подкреплением — этапа посттренинга, в рамках которого модели осваивают поведенческие шаблоны в симулированной среде. Для этого применялись крупные кластеры графических процессоров Nvidia. Этот процесс также использовался для обучения серии o. Открытые модели имеют схожую структуру цепочки размышлений, в которой требуется дополнительное время и вычислительные ресурсы для проработки ответов. OpenAI заявляет, что открытые модели хорошо подходят для ИИ-агентов: они могут вызывать инструменты вроде веб-поиска или выполнять код на Python в ходе рассуждений. Однако они работают только с текстом, то есть не могут обрабатывать или генерировать изображения и аудио. Не совсем прозрачно OpenAI выпустила gpt-oss-120b и gpt-oss-20b под лицензией Apache 2.0, которая позволяет предприятиям монетизировать открытые модели OpenAI без необходимости платить или получать разрешение от компании. Однако фирма не опубликовала обучающие данные, которые использовались для создания нейросетей. Решение неудивительно, учитывая несколько судебных процессов против ИИ-разработчиков за «неправомерное» использование информации для настройки искусственного интеллекта. OpenAI несколько раз откладывала выпуск открытых ИИ-моделей из соображений безопасности. Компания исследовала в том числе возможность использования gpt-oss для кибератак и создания оружия. Компания провела тестирования и заявила, что модель способна незначительно увеличить биологические возможности. Доступ к AWS С выходом открытых ИИ-моделей от OpenAI Amazon заявила, что они станут доступны на Amazon Web Services. Это первый случай, когда нейросети стартапа представлены на площадке. Microsoft также предлагает версии двух новых ИИ, оптимизированные для устройств на Windows. OpenAI — самая дорогая в мире Стартап OpenAI ведет переговоры с инвесторами о продаже акций. Предполагаемая оценка — $500 млрд. Это позволит ей обойти SpaceX Илона Маска и стать самой дорогой частной технологической компанией в мире, пишет Financial Times. На данный момент фирма находится на этапе закрытия последнего раунда финансирования с оценкой в $300 млрд. О нем стало известно в конце марта. https://forklog.com/news/ai/smi-openai-privlekla-8-3-mlrd-pri-otsenke-v-300-mlrd Однако параллельно уже ведутся переговоры с Thrive Capital и другими инвесторами касательно нового раунда. Если он будет закрыт, OpenAI обойдет SpaceX, недавно оцененную в $400 млрд. По информации издания, OpenAI изучает возможность вторичной продажи акций, которая позволит нынешним и бывшим сотрудникам продать ценные бумаги. Цена размещения пока не определена. Объем продажи будет зависеть от спроса инвесторов. Напомним, в июле OpenAI представила специальный режим обучения для студентов в ChatGPT, который помогает прорабатывать задачи поэтапно, а не просто получать готовый ответ.


면책 조항 읽기 : 본 웹 사이트, 하이퍼 링크 사이트, 관련 응용 프로그램, 포럼, 블로그, 소셜 미디어 계정 및 기타 플랫폼 (이하 "사이트")에 제공된 모든 콘텐츠는 제 3 자 출처에서 구입 한 일반적인 정보 용입니다. 우리는 정확성과 업데이트 성을 포함하여 우리의 콘텐츠와 관련하여 어떠한 종류의 보증도하지 않습니다. 우리가 제공하는 컨텐츠의 어떤 부분도 금융 조언, 법률 자문 또는 기타 용도에 대한 귀하의 특정 신뢰를위한 다른 형태의 조언을 구성하지 않습니다. 당사 콘텐츠의 사용 또는 의존은 전적으로 귀하의 책임과 재량에 달려 있습니다. 당신은 그들에게 의존하기 전에 우리 자신의 연구를 수행하고, 검토하고, 분석하고, 검증해야합니다. 거래는 큰 손실로 이어질 수있는 매우 위험한 활동이므로 결정을 내리기 전에 재무 고문에게 문의하십시오. 본 사이트의 어떠한 콘텐츠도 모집 또는 제공을 목적으로하지 않습니다.