1月15日,科大讯飞正式宣布,联手华为成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。
发布会现场,科大讯飞研究院的研究员们依次展示了讯飞星火X1解答高考题、AIME竞赛题以及高中奥赛题的表现。讯飞星火X1不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。
值得一提的是,讯飞星火X1在近期参加的小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项“考试”中成绩十分亮眼,用更少的算力,实现了业界一流的效果,多项指标国内第一。
在医疗领域,讯飞星火X1的模型策略已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。发布会上,科大讯飞还宣布将在今年上半年正式发布基于讯飞星火X1的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。
同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,七大核心能力全面提升,全面对标OpenAI 最新版的GPT-4o。此次升级最重要的特点,是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。
大模型的长文本能力一直是用户关注的重点,特别是在企业知识问答这类严谨的应用场景中,用户对大模型幻觉的容忍度几乎为零。因此,讯飞星火推出了基于智能体的全新长文本框架,并行业首发了句子级溯源功能。这一新框架优化了超长注意力机制,同时利用大规模网页和书籍数据进行知识关联式合成,使得知识回复的错误率降低了40%,句子级溯源效果更是超越了GPT-4o。
根据第三方数据,2024年,合肥本土企业讯飞星火在大模型中标数量和中标金额上取得“双第一”,尤其是在能源、金融、汽车、运营商等行业,合作打磨了近百个智能体应用。
文字 | 合肥通客户端-合报全媒体记者 刘小容编发 | 全媒体编辑 韩洁出品 | 合报科学+融媒体工作室
一审 | 韩洁;二审 | 束芳;三审 | 许超众
【未经授权,严禁转载!联系电话028-86968276】