让AI回答更可靠,
7月25日,科大讯飞宣布基于
全国产算力训练的深度推理
大模型讯飞星火X1再次升级,
在“AI幻觉”治理问题上取得显著突破,
超越业界主流模型。
“一本正经地胡说八道”,是许多人对当前开放式内容生成功能的观感和评价,这也就是业内所说的“AI幻觉”。升级后的星火X1在内容可靠性上大幅提升,大大解决“AI幻觉”问题。星火X1升级后无论是对自身生成内容真实性的把控(事实性幻觉治理),还是在参考外部资料时对原文的忠实程度(忠实性幻觉治理),都有显著改善。
整体来看,新版本综合能力大幅提升,在翻译、推理、文本生成、数学等核心能力上,已能对标OpenAI o3等国际一流大模型最新版本效果;多语言能力更是扩展至130余种。与此同时,基于星火X1的语音同传大模型也迎来全面升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体均取得新突破,在复杂行业场景任务上进一步满足用户核心需求。
讯飞星火X1此次跃升,背后是一系列原创性技术突破的集成。
面对大模型容易“胡说八道”的通病,科大讯飞提出基于多路径采样验证及事实性约束强化学习的幻觉治理技术,在大模型思考过程及回复生成阶段,实现客观问题与标准答案的深度强对齐,大幅减少了在慢思考下的幻觉率,让大模型回复通用常识及专业知识问题更加可靠。
在数据层面,科大讯飞更是开创性地提出了基于人类专家数据的通用认知任务数据反写技术,有效地解决了SFT高质量数据获取困难、人工标注费时费力等现实挑战,实现了主观语言类任务文笔和风格化的显著提升。
文字 | 合肥日报-合新闻记者 张玉莲 通讯员 许可亮编发 | 全媒体编辑 吴弘出品 | 合报科学+融媒体工作室
一审 | 吴弘;二审 | 苏晓琼;三审 | 周军
合肥日报继续给粉丝送福利啦!
①在合肥日报微信公众号推送的每篇文章下面“点赞”、❤️“推荐”和“分享”。②每月15日和30日各发放6份福利,微信后台依据最新技术进行统计,自动确定近两周阅读量前两名、“推荐”量前两名以及“分享”量前两名。快来参与吧!(奖品需自行领取,不在合肥本地的粉丝可以到付方式邮寄)。
加入粉丝群方式
↓↓↓
在微信公众号聊天对话框输入关键词“粉丝群”加入合肥日报粉丝群※活动最终解释权为本报所有,如有疑问请加入粉丝群咨询
【未经授权,严禁转载!联系电话028-86968276】
