上新啦!讯飞首个支持长文本、长图文、长语音的大模型发布

IDC预测,全球数据信息产生和复制量将在2025年达到175ZB(1ZB相当于1万亿GB)。假设每个人的大脑功能记忆容量约为1.25TB,那么需要超过280亿个人脑来处理这些信息,相当于全球人口的4倍。

4月26日,讯飞星火V3.5春季上新,科大讯飞董事长刘庆峰发布讯飞星火大模型一系列新功能。让每个人对知识的萃取与使用,都拥有全新的可能。

作为首个全国产算力训练的完全自主知识产权的大模型,讯飞星火本次正式上新长文本、长图文与长语音能力,首发星火图文识别大模型,快速识别和学习多类型海量知识,行业场景下的回答更专业、更精准。

同时,“多情感超拟人合成”和“一句话声音复刻”首发,实现更生动、更具个性化的表达,带来更有温度的人工智能体验。
 

长文本、长图文、长语音 首个全支持的大模型


1964年,著名传播学家马歇尔·麦克卢汉写道,“人类曾经以采集食物为生,而如今他们重新要以采集信息为生”。

自讯飞星火发布以来,一直践行“解放生产力 释放想象力”的目标。在知识问答、文本总结与图片生成等领域,讯飞星火在国内众多大模型相当“能打”,稳居头部梯队,星火APP安卓下载量位居国内工具类大模型APP顶流。

今天,讯飞星火上线长文本、长图文、长语音能力,让信息采集变得轻而易举。

  • 长文本能力全新升级

随着应用的深入,越来越多的用户希望,借助大模型实现面对海量文本时的快速知识学习和获取,以及在专业领域内问答的准确率问题。

讯飞星火实现了长文本能力全新升级。目前星火大模型通用长文本能力,包括长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等,总体已经达到GPT-4 Turbo 今年4月最新长文本版本的97%的水平,而在多个垂直领域的知识问答任务上,星火大模型长文本总体水平已经超过GPT-4 Turbo。

对追求效率的用户和企业来说,长文本处理的效率是影响体验的重要要素。通过“剪枝”和“蒸馏”,讯飞推出了业界最高性能的13B,130亿的模型来处理长文本。在效果损失仅3%以内的情况下,使文档上传解析、知识问答的首响时间以及文字生成上获得极大效率提升,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本,星火大模型的上述性能均为业界最优。

例如,上传《星火相传》一书后,可以基于书本内容向大模型输出指令,进行提问和内容再创作。

目前,讯飞星火可实现对不同格式(pdf、txt、doc、docx、markdown)的多文档同时解析,单个文档处理大小可达100M。

借助讯飞星火的长文本功能,文学研究专家可以快速阅读上百万字的史诗级著作,提出自己关注的问题;高校学生面对多个论文,能快速总结关键信息,成为帮助自己学习上的最佳辅助。此前面对长文档的一筹莫展、费时费力,在长文本功能面前都烟消云散。

  • 长图文能力升级

俗话说,“百闻不如一见”。视觉是我们认知世界的重要方式。各种票据、随手拍下的PPT和课堂板书、书籍、APP截图,这些图片、图文信息也是我们日常生活中需要处理的知识载体之一。

在图文识别、公式识别等领域,讯飞连续多年在国际性专业权威比赛中获得冠军。基于核心技术的突破和积累,星火图文识别大模型发布,可实现复杂版面的高精度解析、融合篇章语义的文字识别、覆盖更多领域的专业符号识别。

复杂版面的高精度解析:覆盖31个场景(教育类书籍、学术论文、报纸、PPT等)、18类关键要素(页眉、页脚、表格等),多层级关系预测,符合人类自然阅读顺序
融合篇章语义的文字识别:基于篇章上下文端到端建模,深层次理解语义,识别更精准
覆盖更多领域的专业符号识别:面向教育、金融、科研等专业领域深度优化
效果方面,国际公开的权威英文测试集以及典型场景的识别效果均显示讯飞星火图文识别功能处于业界领先。

在长文本、长图文、长语音加持下,讯飞星火将在多个专业场景,推动行业进步,促进生产力提升。助力智能评标助手全面升级,评标更便捷、更高效、更准确,在国家能源集团已评审5.7万余单,评审准确率达97%。

本次发布会上,基于大模型的知识获取和学习能力的提升,星火合同助手正式上线。在装修、租赁或购买房屋、与客户签约合同等场景下,星火合同助手可以通过关键要素提取,帮你识别潜在的风险漏洞,同时还可对合同进行总结、生成合同,不仅能提高办公效率,更是大大降低了我们日常生活工作权益保护的门槛。

  • 长语音能力升级

《中国网络视听发展研究报告(2024)》提到,截至2023年12月,我国网络视听用户规模达10.74亿人,排互联网应用首位。图文之外,音视频也是如今我们获取知识内容的重要途径。

与文本相比,音视频的信息量和数据量更大。无论是学生上网课、职场人士参加会议、还是记者外出参访,当需要对音视频信息进行再次处理时,往往会耗费大量时间和精力。

结合讯飞领先的语音识别和翻译技术,讯飞星火长语音能力升级,支持长音视频一键总结,快速获取其中的内容。

借助长语音能力,学生可以轻松总结网课内容,应对备考;记者可以在短时间内总结访谈内容,提高出稿效率;职场人士开会时不必手忙脚乱,会议记录和重点可在会后快速总结。

句话声音复刻 拥有你的赛博声优


2024年1月30日,讯飞就正式发布了星火语音大模型,可实现超拟人对话,超拟人语音合成拟人度达到83%+。

经过持续迭代,讯飞星火对情绪表达的可感知度达到85%以上,让高兴、抱歉、安慰、撒娇、困惑等语气表达更生动,让冰冷的AI大模型变得生动活泼。

曾经,讯飞凭借语音合成的深厚积累,通过1个小时的语音为导航软件定制各种个性化声音,让淘云故事机实现5分钟复刻爸爸妈妈的声音讲故事。

现在,使用星火APP可实现一句话声音复刻!只需录制一句话,通过讯飞星火大模型训练目标发音人的特征,合成出目标发音人音色相同的语音,操作简单、省时省力。

当普通人都能轻松利用AI复刻自己声音时,亲情与陪伴将可以穿越时空限制,弥补身隔两地的遗憾。


常年在外工作不能陪在孩子身边的父母,复刻你的声音,为远在家乡的孩子讲睡前故事,让你的声音陪伴他们入眠;在异地的游子,你的声音可为空巢的父母读书、解惑,提醒他们注意身体健康。

开发者生态蓬勃发展 超过50%应用企业刚需场景


自2023年发布以来,星火大模型开发者生态持续蓬勃发展。2024年1月30日至今,仅三个月,开发者团队就新增超55万,其中超过50%的应用服务于企业刚需场景。

企业是解放生产力的重要主体,如何帮助企业更快地构建智能体,更好地使用大模型的能力?

全新的智能体构建的平台:讯飞星火智能体平台,正式推出!

星火智能体平台以讯飞星火为底座能力,解决了任务解析及规划、匹配任务工具、内外部知识信息源打通和任务执行及汇总的关键环节。


“未来的主流是:线上线下结合、虚拟现实结合、人和机器的结合”,科大讯飞董事长刘庆峰表示。

讯飞星火要通过技术进步,解决企业知识学习和获取的最后一公里问题。让每一个人都拥有属于自己的智能体助手,解放每个人的生产力,释放出更多精力做更有想象力、更代表未来的工作。

星火APP支持助手创建 零代码定制AI助手


400多年前,英国哲学家弗兰西斯·培根说:“知识就是力量,但更重要的是运用知识的技能”。400多年后的今天,讯飞星火正在成为每个人获取知识、学习知识的“超级助手”,成为解放生产力、释放想象力的“超级杠杆”。

自2023年6月,讯飞星火助手上线,已覆盖职场、创作、营销、编程、学习、旅行等十多种场景,让2400万+用户拥有了一个24小时待命的全能助手。助手被来自千行百业的开发者创建,其中9700+助手已经开放使用。

今天,星火助手功能焕新,支持移动端创建。无论是上下班路上还是旅行途中,用户都可随时拿出手机,简单几步,迅速生成一个AI助手。

无需编写专业代码,只需填写角色设定、目标任务、需求说明、风格设定等结构化指令,用户即可快速创建出专业的助手。

One More Thing

“让科技有情怀,让公益暖人心”,2017年,讯飞开放平台启动了“三声有幸”公益计划。坚持开放先进技术和能力为公益特殊群体服务,用AI给予特殊群体更多力所能及地关注和爱护。

三声有幸A.I.公益计划正式面向公益开发者免费开放最高100亿讯飞星火 API tokens,用星火助力AI公益,让大模型普惠每个人。访问讯飞开放平台官网,进入AI公益官网页面,提交相关资料即可申请参与。


迈向未来,人工智能已成为绕不开的重要地标!根据益普索的最新调查显示,过去一年中,认为人工智能将在未来三到五年内深刻改变其生活的受访者比例从60%跃升至66%。

作为国产大模型头部梯队,讯飞星火保持持续升级,不断缩减与国际大型模型企业间的差距,加速大模型技术的应用落地。

春季上新,次第花开,刘庆峰最后透露:今年6月27日,讯飞星火V4.0将正式发布。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值