OpenAI 推出两款开源模型,GPT-5蓄势待发!

OpenAI 推出两款开源模型,GPT-5蓄势待发!

8月6日消息,OpenAI宣布推出两款开源模型GPT-oss-120b和GPT-oss-20b,这是自2020年发布GPT-2以来,OpenAI首次推出开源语言模型。这两款模型均可在Hugging Face在线开发者平台上免费下载,OpenAI称其在多个用于比较开源模型的基准测试中表现“处于前沿水平”。

两款开源模型亮相,性能与兼容性兼具

据每日经济新闻援引OpenAI介绍,两款gpt-oss模型采用了其最先进的预训练和后训练技术,特别注重推理、效率和跨部署环境的实用性。它们都是使用专家混合(MoE)架构的Transformer,以减少处理输入所需的活跃参数数量。

gpt-oss-120b每个token激活5.1亿参数,总参数量为1170亿;gpt-oss-20b激活3.6B参数,总参数量为210亿。模型使用交替的密集和局部带状稀疏注意力模式,支持高达128k的上下文长度。OpenAI称gpt-oss-20b是一款中型开放模型,gpt-oss-120b则是可在“大多数台式机和笔记本电脑”上运行的大型开放模型。

OpenAI表示,较小的模型至少需要16GB显存或统一内存才能发挥最佳性能,并且“非常适合高端消费级GPU和搭载苹果芯片的Mac电脑”。较大的全尺寸模型则需要至少60GB显存或统一内存。

从性能上看,gpt-oss-120b在核心推理基准测试中表现接近OpenAI o4-mini,在竞赛编码(Codeforces)、通用问题求解(MMLU和HLE)以及工具调用(TauBench)等方面超越了o3-mini,甚至在健康相关查询(HealthBench)和竞赛数学(AIME 2024和2025)的表现上优于o4-mini。而gpt-oss-20b虽规模较小,但在相同评估中达到或超过了o3-mini的性能,尤其在竞赛数学和健康领域表现突出。

开源战略转变,应对市场竞争压力

此次OpenAI重新推出开源模型,源于其在开源技术方面态度的转变。今年1月,DeepSeek引发了开源AI热潮,奥尔特曼随后承认OpenAI在开源技术上“站在了历史的错误一边”。此次发布开源模型,正是OpenAI对市场趋势的回应,旨在重新融入开源生态,增强自身在AI领域的竞争力。

市场竞争的加剧无疑是OpenAI此举的重要驱动力。近年来,众多科技公司和研究机构在开源AI领域积极布局,推出了一系列具有竞争力的模型。谷歌DeepMind于8月4日宣布推出第三代通用世界模型Genie 3,能够生成多样化的交互式环境,在模拟环境领域展现出强大的技术实力。面对竞争对手的不断发力,OpenAI通过开源模型,有望吸引更多开发者和企业参与其生态系统,巩固自身的市场地位。

此外,OpenAI与英伟达、AMD、Cerebras和Groq等芯片制造商展开合作,确保模型在各种芯片上能够良好运行。英伟达CEO黄仁勋表示,OpenAI在英伟达AI平台上推动了开源软件的创新。这一系列合作将进一步提升OpenAI模型的性能和适用性,为用户提供更优质的体验。

模型安全性引关注,市场期待GPT-5​

尽管OpenAI的开源模型在性能上表现出色,但相较o3和o4-mini模型,两款开放模型更容易出现“幻觉”现象。OpenAI解释称,由于较小的模型所拥有的世界知识相对较少,因此更容易产生幻觉。在OpenAI内部用于衡量模型对人物知识准确性的PersonQA基准测试中,gpt-oss-120b和gpt-oss-20b分别对49%和53%的问题产生幻觉,显著高于o4-mini模型的36%。

针对开放权重模型可能面临的安全风险,OpenAI给予了特别关注。在预训练期间,公司过滤了与化学、生物、放射性和核(CBRN)相关的有害数据,并对模型进行了专门的生物学和网络安全数据微调,以评估潜在风险。经过内部和外部测试,这些恶意微调的模型无法达到其准备框架中的“高能力”阈值。

随着OpenAI此次开源模型的发布,市场对其下一个重磅产品的期待愈发高涨。鉴于公司近期不断释放的新消息,市场普遍预期OpenAI的下一个重大更新将是推出GPT-5。

浙商证券7月27日发布的报告指出,GPT-5的模型思路围绕“简化、统一、多模态”展开,它将整合GPT系列基础模型、o系列推理模型以及GPT-4o全模态模型的三方能力。奥特曼早在2025年2月就曾透露,GPT-5将简化产品线,实现更强更统一的功能;6月的播客中,他再次强调了GPT-5的融合能力。

中信证券8月1日发布的研究报告预计,相较于GPT-4单次激活2770亿的规模,新一代模型GPT-5单次推理的算力消耗不会大幅增加,API价格或较GPT-4o仅小幅增长甚至维持不变,推理性价比有望提升一倍以上,这将显著改善AI应用的盈利能力。

(经济观察网 刘晓/文)

免责声明:本文观点仅代表作者本人,供参考、交流,不构成任何建议。

文字来源于网络。发布者:经济观察报,转转请注明出处:https://www.sxkyhb.cn/14573.html

(0)
经济观察报的头像经济观察报
上一篇 2025年8月6日 下午2:47
下一篇 2025年8月6日 下午2:48

相关推荐

  • 联手“国家队” 亿航智能发力海洋及运河低空领域

    作者 李强 近日,亿航智能宣布与中交第四航务工程勘察设计院有限公司(以下简称:“中交四航院”)、中国交通信息科技集团有限公司(以下简称:“中交信科”)签署战略合作协议。三方将共同探索低空经济领域的创新合作模式,推动低空经济产业高质量发展,打造具有国际竞争力的低空经济产业生态。 聚焦六大核心领域 三方明确将聚焦六大核心领域开展深度合作:低空经济基础设施规划与标…

    2025年5月21日
    3100
  • 海博思创AI“超级运维助手” 推动企业迈向数智运维新时代

    在AI加速行业数智化发展的大潮下,海博思创推出了超级运维助手“海博精灵HyperGenie”,服务储能电站运维提效降本。“海博精灵HyperGenie”是一款基于国产开源通用大模型和私域储能领域知识库进行设计开发的专属智能体,提供精准故障定位、多场景操作指导、灵活数据分析探索等运维辅助服务,推动企业迈向数智运维新时代。 从软件产品到工作助手 “海博精灵Hyp…

    2025年5月14日
    4800
  • 亿元传奇:王阳明真迹以1.09亿人民币高价成交

    艺术动态 《王阳明先生诗翰》手卷 据“雅昌”“古籍”等艺术类媒体报道,5月10日晚在日本大阪举办的“雅宝2025春拍”上,一卷明代思想家王阳明手书诗翰以21.8亿日元(约1.09亿元人民币,含佣金)成交。这一历史性的成交价格,一举创下了明代书法作品在公开拍卖场合的世界纪录。 王守仁,号阳明,宁波余姚人,获封“新建伯”,谥号“文成”。他创立的阳明心学对日本以及…

    2025年5月16日
    3100
  • 险资举牌频繁

    持续一年多的险资举牌热度不减,与险企希望稳定净资产收益率、降低净利润波动等因素相关。因此,被投公司主要集中在银行、交运、公用事业等盈利能力稳定、分红率较高的行业,且港股相较A股更受青睐。 宗合/文 据统计,近10年来,保险行业出现过三轮举牌热,分别是2015年和2020年,2024年以来险资开启第三轮举牌高峰,至今热度不减。中国保险行业协会网站显示,截至7月…

    2025年7月17日
    1000
  • 字节发布GR-3大模型,开启通用机器人“大脑”新纪元

    7月22日,字节跳动Seed官方公众号宣布推出一款名为GR-3的全新Vision-Language-Action Model(VLA,视觉-语言-动作)模型。据称,该模型拥有强大的泛化能力、对抽象概念的理解以及精细操作柔性物体的能力。 GR-3:多样数据训练 高效解读指令 GR-3模型的核心优势在于其出色的泛化能力和对抽象概念的理解。与传统的VLA模型不同,…

    2025年7月22日
    1400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信