讯飞星火X1升级版模型宣布上线: 整体效果对标 OpenAI o3 等
- 2025-07-25 18:16:17
- 463
IT之家7月25日消息,科大讯飞今日发布公告,宣布基于全国产算力训练的深度推理大模型——讯飞星火X1升级版正式上线。
此次升级,星火X1在多个任务上持续进步,综合能力再升级,特别是在翻译、推理、文本生成、数学、多语言上效果亮眼。
同时,在幻觉治理方面,对于大模型自身生成内容是否符合客观事实的事实性幻觉治理,以及在用户给定额外参考资料时大模型回复是否忠于原文的忠实性幻觉治理两方面均取得明显进步,显著提高了大模型行业落地应用的可靠性。
这是一次全面的跃升:
综合能力大幅提升。整体效果对标OpenAIo3等国内外一流大模型最新版本效果,在翻译、推理、文本生成、数学等方面保持领先。
幻觉治理取得显著进步。幻觉问题是掣肘大模型落地应用的关键问题,升级后的星火X1在幻觉治理方面领先业界主流模型。
多语言能力已覆盖130+语种。为世界提供全栈自主可控大模型底座的“第二种选择”。
基于星火X1底座的语音同传大模型在翻译效果、实时响应、语音听感、专业精深等方面大幅跃升,持续行业领先。
得益于星火X1模型的升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体也取得了新的进步,在复杂行业场景任务上进一步解决用户关键刚需。
星火X1最新升级的能力可直接在讯飞星火网页版和App进行体验,全新API已同步上线讯飞开放平台。
测试方面,今年6月,在国内大模型挑战全国高考数学一卷的评测中,星火X1-0420版本突破了140分。本次升级,数学能力再次精进。
科大讯飞表示,它采用了业界首创基于文本自适应调度的流式语音合成技术,让“译”与“说”无缝耦合,在语音听感上的自然度、拟人度和舒适度显著跃升。
在翻译效果上,基于内容完整度、信息准确度、语言质量等多方面主客观评价计算翻译综合质量得分(分值0~100分),新版本同传大模型效果较2025年1月首发版本提升20%,特别是有效消除了传统同传的碎片化割裂感,在多人会议等复杂场景中英双向翻译得分可达80分以上,单人演讲翻译得分超90分。
新模型还具备智能双语识别功能,能够自动识别中英文混合发言并实时切换翻译方向。在双边会议、国际商务洽谈等中英交替的场景中,参会者可以随时用母语发言,有效避免了因语言切换操作而造成的交流中断。最新语音同传大模型已经在讯飞双屏翻译机2.0、讯飞AI录音笔、讯飞同传等产品中全面上线。
面向软件研发提质增效的星火代码大模型,有效提升了项目级代码理解与生成、单元测试智能体、WEB应用对话式编程等核心任务表现。目前,星火代码大模型已深度赋能金融、制造、能源、科技等100余家关键领域客户,在典型应用场景中驱动研发效率提升超过50%。