深度推理模型X1发布！讯飞星火再升级_大模型可以通过哪些技术降低回复错误率-CSDN博客

本文链接：https://blog.csdn.net/AI_Platform/article/details/145182508

1月15日，科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1，并率先应用于教育、医疗等刚需场景。

同时，讯飞星火4.0 Turbo底座能力再次迎来全新升级，图文、数学和长文本能力显著提升，并首发混域知识搜索技术，进一步解决行业、企业痛点。

此外，作为国内智能翻译领域的佼佼者，科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型，最快语音同传时延小于5秒。

01 讯飞星火X1发布，多项指标国内第一

一直以来，讯飞坚信“唯有自主可控才有通用人工智能的大未来”。面对全国产算力平台上训练深度推理模型遭遇的诸多挑战，讯飞携手华为，成功攻克了训练推理强交互、高吞吐推理优化等一系列难题，最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火X1。

新发布的讯飞星火X1面对各种类型的数学问题，不仅能够化繁为简，模拟人类思考过程把复杂问题拆解成多个步骤进行推理，还可以根据答案正确与否进行强化训练。

现场实机演示中，从国内的高考真题、高中奥赛题，到难度级别仅次于数学奥林匹克竞赛的AIME数学竞赛题，讯飞星火X1都可以准确解答。在分步骤给出准确答案的同时，清晰展示出了解题思考的过程，包括对题目中涉及到的各种概念进行理解、分析、计算，让用户“知其然，更知其所以然”。

近期，讯飞星火X1也参加了小初高（含竞赛）、大学（含竞赛）、AIME、MATH等500多项考试，取得了亮眼的成绩，用更少的算力，达到业界一流的效果，多项指标国内第一。

大模型的发展，应用才是硬道理。讯飞星火X1已率先在教育和医疗领域实现应用落地。

教育场景：让教师教学更轻松，学习指导更精准

讯飞星火X1已成为北京、上海、合肥等地的教研员和老师的PLUS助手，受到老师们的表扬。搭载了讯飞星火X1的讯飞AI学习机，可以更精准的为孩子进行学习诊断和推荐指导，真正实现“因材施教”。

医疗场景：高水平辅助医生处理疑难杂症

基于知识反思和思维链技术，结合医疗循证推理技术，构建医疗复杂推理能力的X1模型，专科辅助诊断和复杂病例内涵质控目前都达到了90%。同时，讯飞已经联合华西发布了医学大模型“华西黉医”，显著提升了复杂病历内涵质控效果；联合北京安贞医院发布了心脏诊断大模型，为心血管疾病的辅诊推理带来了技术突破。讯飞将在今年上半年正式发布基于X1的医疗大模型升级版，在更大范围为医生提供更专业更高水平的辅助。

02 讯飞星火4.0 Turbo全新升级，更懂行业的大模型

此次发布，讯飞星火4.0 Turbo的底座能力也迎来了全新升级，七大能力全面提升，全面对标OpenAI 最新版的GPT-4o。

并围绕企业客户的落地诉求和2亿+C端用户的真实反馈，在行业知识、图文识别、长文本等能力上进行了重点升级。

高价值数据训练行业能力全面提升

得益于行业龙头企业合作收集整理的海量高价值文本训练数据，及针对行业应用落地打磨的数十万高质量行业场景的SFT数据，讯飞星火4.0 Turbo持续学习能源、金融、汽车、运营商等领域知识，成为更懂行业的大模型。

根据第三方数据，2024年，讯飞星火在大模型中标数量和中标金额上取得“双第一”，尤其是在能源、金融、汽车、运营商等行业，与客户共同打磨了近百个智能体应用。

长文本能力提升知识回复错误率下降40%

为解决企业知识问答出现的“幻觉”问题，讯飞星火4.0 Turbo研发了基于智能体的全新长文本框架，并行业首发了句子级溯源功能。

这一新框架优化了超长注意力机制，同时利用大规模网页和书籍数据进行知识关联式合成，使得知识回复的错误率降低了40%，句子级溯源效果更是超越了GPT-4o，显著缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。

图文识别能力提升 2分钟解析500页文件

此次升级，讯飞星火4.0 Turbo强化了复杂场景的图文识别能力，可以看懂各类行业文档的复杂版面，帮助企业用户充分利用大量的高价值数据。

比如，医疗的体检报告、法院的文书、学术论文、企业合同、复杂产品说明书这些，里面经常有复杂长表格、杂乱板式、手写公式、印章手写合同、倾斜少线等等情况，星火不仅能够准确识别，还能进行合理排版，大大降低人力成本。

新发布的扫描文档解析的极速版本，让文档理解速度提升10倍，极大缩短了处理大量行业文档、构建私域知识库的时间。一份500页的项目文件，加上扫描、识别、解析的时间，只要2分钟就能全部搞定！

基于行业、图文、长文本等能力的提升，科大讯飞还行业首发了混域知识搜索技术，实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索，句子知识溯源准确率达90%。用户只需一次提问，即可获得综合搜索后的结果，大大提升信息搜索效率。

全新升级的能力除了在讯飞星火体验之外，也已上线在讯飞绘文、讯飞智文两款星火原生应用。

03 首发星火语音同传大模型，媲美人类同声传译

在今天的升级发布会上，针对国际交流中的高难度同传翻译需求，讯飞发布了国内首个具备端到端语音同传能力的大模型——星火语音同传大模型。

星火语音同传大模型深度模拟人类同传译员的思维过程，可以听到声音后进行实时意群理解和切分，结合上下文语境精准选词，并进行碎片化信息的重组，确保整个翻译过程更加流畅。

例如，I went to iFLYTEK for a seminar at 10 o'clock yesterday 这句话的意思是“昨天十点，我去讯飞参加了一场研讨会”。星火语音同传大模型是这样翻译的：

首先对句子进行意群切分：I went to iFLYTEK// for a seminar// at 10 o'clock // yesterday.

这句话机器直译为“我去讯飞，为了一场研讨会，在10点，昨天”

现在有了大模型的生成能力做信息重组，最终就能翻译成“我去了讯飞，去参加一场研讨会，时间是昨天上午十点”

在长达5H的音视频测试中，星火语音同传大模型与Gemini2.0、GPT-4o等国外主流大模型相比，在内容完整度、信息准确度以及语言质量等评价维度具有领先优势。

基于星火语音同传大模型的发布，在日常对话、医疗等专业领域，讯飞全系产品的翻译能力得到进一步提升。

事实上，在机器翻译和语音识别领域，讯飞有着深厚的技术积累，早在2018年科大讯飞就成功通过了全国翻译专业资格考试，且在最近连续3届IWSLT国际口语机器翻译比赛都获得了冠军。由科大讯飞作为第一完成单位的“多语种智能语音关键技术及产业化”项目获得2023年国家科学技术进步奖一等奖。这是深度学习引发全球人工智能浪潮以来，过去十年人工智能领域首个国家科学技术进步奖一等奖。

伴随着大模型在处理复杂问题、执行多步骤任务方面展现出的潜力，未来生成式AI的应用将更加智能化，为各行各业带来前所未有的效率提升和创新机会。

坚持自主可控的国产化路线，随着飞星二号的算力持续到位，以及行业落地带来的飞轮效应，讯飞将加快深度推理模型的优化迭代，推动AGI迈向新纪元。

目前，用户可以在最新版讯飞星火App和星火网页端上搜索“深度推理模型X1”智能体，体验讯飞星火X1强大的数学解题能力。