讯飞星火 X1升级,幻觉治理领先业界主流模型
- 2025-07-26 13:43:33
- 446
开放式内容生成功能目前饱受诟病,最核心的问题在于,人工智能所生成的内容并非百分之百准确。
“一本正经地胡说八道”,是许多人对当前开放式内容生成功能的观感和评价。而这一状况将彻底改变,7月25日,科大讯飞宣布基于全国产算力训练的深度推理大模型讯飞星火X1再次升级。
星火X1取得显著突破,无论是对自身生成内容真实性的把控(事实性幻觉治理),还是在参考外部资料时对原文的忠实程度(忠实性幻觉治理),都有显著改善,大大提升了大模型在行业应用中的可靠性。
整体来看,新版本综合能力大幅提升,在翻译、推理、文本生成、数学等核心能力上,已能对标OpenAIo3等国际一流大模型最新版本效果;多语言能力更是扩展至130余种。与此同时,基于星火X1的语音同传大模型也迎来全面升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体均取得新突破,在复杂行业场景任务上进一步满足用户核心需求。
全国产大模型
讯飞星火X1此次全面跃升,背后是一系列原创性技术突破的集成。
面对大模型容易“胡说八道”的通病,科大讯飞提出基于多路径采样验证及事实性约束强化学习的幻觉治理技术,在大模型思考过程及回复生成阶段,实现客观问题与标准答案的深度强对齐,大幅减少了在慢思考下的幻觉率,让大模型回复通用常识及专业知识问题更加可靠。
在数据层面,科大讯飞更是开创性地提出了基于人类专家数据的通用认知任务数据反写技术,有效地解决了SFT高质量数据获取困难、人工标注费时费力等现实挑战,实现了主观语言类任务文笔和风格化的显著提升。
值得一提的是,就在升级发布的前一天,7月24日,中欧企业家座谈会在北京召开,科大讯飞董事长刘庆峰作为27家中方企业之一在前排落座,是本次参会企业中唯一的人工智能企业。而在今年2月,刘庆峰作为人工智能领域唯二代表与DeepSeek梁文锋共同出席民营企业家座谈会。
科大讯飞董事长刘庆峰两度现身国家高规格企业家座谈会,是中国人工智能核心技术自主化进程的战略缩影,也标志着科大讯飞“人工智能国家队”战略地位再获顶层背书。
科大讯飞目前担任由国家市场监督管理总局和国家标准化管理委员会指导的国家人工智能标准化总体组大模型专题组联合组长、全国机器人标委会人形机器人标准化工作组副组长,国家数据局指导的全国数据标准化技术委员会首届委员,工信部人工智能标准化技术委员会首届委员,教育部教育信息化技术标准委员会委员,并承担全国智能语音领域唯一的“国家级技术标准创新基地”的筹建工作。
既要也要
多语言能力一直是讯飞的强项,此次升级将这一优势进一步放大。
目前,星火X1已支持130+语种的交互问答、数学解题、文本生成、翻译等任务,为全球用户提供了真正意义上的“第二选择”。强大的多语言能力也让讯飞的同传会议服务、SaaS产品,以及翻译机、录音笔等智能设备的翻译效果和用户体验都迈上了新台阶。
最令人惊喜的是首字响应速度的突破。过去使用翻译工具,总需要等对方说完半句话才开始翻译,现在中英同传首字响应快至2秒,已达到人类高阶同传的行业标准线。即使在复杂会议或专业研讨等高难度场景中,系统也能在保证准确性的同时维持稳定的实时响应。
不只是快,翻译质量也肉眼可见地变好了。对比半年前的版本,新模型的综合翻译质量提升20%,传统同传翻译中“断断续续”等问题也较好解决,翻译流畅度几乎与母语交流无异。
不只是在多语言领域,在教育、医疗等细分行业上,升级版星火X1均有落地。如升级版星火X1,作业批改、个性化推荐、答疑辅学、科普问答及口语学习等多项能力显著提升,进一步扩大了科大讯飞在教育领域的领先优势。
在强化学习技术上,科大讯飞将评语模型与细粒度反馈的强化学习技术结合起来,让原本简单粗糙的数值奖励变成了详细的文本指导,就像给AI配了一位耐心的老师,能在解题的每个环节给出具体建议。这种做法让复杂的数学推理训练变得更加高效,也解决了强化学习训练中“奖励太少”的痛点问题。
借助星火X1的升级赋能,讯飞医疗各项核心能力实现全面跃升。在全科辅助诊断、体检报告解读、健康咨询、导医导诊等通用医疗任务上,星火医疗大模型持续保持业界大幅领先。其中,在医生辅助诊疗方面,星火应用范围不断扩大,已覆盖从基层全科到三甲专科、从门诊到住院的完整诊疗链条。目前在四川大学华西医院、北京安贞医院、中国科学技术大学附属第一医院等多家知名医院开展试点,核心效果表现保持行业领先水平。
从技术追赶到需求引领,讯飞星火X1展现了一条务实的发展路径:既要在核心技术上不断攀登新高度,也要在实际应用中解决真问题,让AI技术真正服务于各行各业的发展需要。在大模型竞争日趋激烈的今天,那些既有技术实力又能满足用户真实需求的企业,往往更容易脱颖而出。
- 上一篇:更新汇总
- 下一篇:陈小春张泽禹披荆斩棘最大年龄差