全球大模型浪潮汹涌而至。
**4月26日,科大讯飞发布讯飞星火V3.5更新版本,成为业界首个支持长文本、长图文及长语音的大模型产品。**超高的下载量,让讯飞星火APP成为国内工具类通用大模型APP排名第一。而在医疗、汽车、金融、科研、生活等领域的落地应用,打开了大模型更大的想象空间。
从比拼参数到解决实际刚需
从2022年开始,大模型在业界逢人必谈,在民间唠嗑也要聊上几句。“能写书不?能唱歌不?能聊天不?”来自应用端的需求问题,正是大模型初代商业化是否成功,面临的第一个重大关口。
知识高效获取,今年以来成为国内大模型用户关注的新方向。掀起这一波注意力的是国内大模型创业公司“月之暗面”。这家公司去年将旗下大模型Kimi的上下文参数规模提升至20万字,今年3月又提升至200万字,迅速引爆市场。3月,阿里旗下通义千问已经将这一数字更新到1000万。
华泰证券研报中指出,具有长上下文的大模型通用性更强,用户将特定领域的知识通过上下文的方式输入到模型中,模型即可通过上下文学习掌握相应内容,一定程度上代替模型的微调。
从应用端来说,长文本功能落地需重点解决两个问题。一是海量文本的高效处理。面对上百万甚至上千万文字,模型后台消耗的运算资源也成倍增加,业界的一些大模型往往智能处理前 20% 或前 50% 的内容,之后的处理效率就大大减慢。二是如何保证大模型在科研、医疗、法律等行业专业场景的准确率,这样才能解决大模型在刚需场景的应用问题。
长文本能力全新升级
也因此,讯飞星火V3.5升级背后的技术支撑,备受关注。
科大讯飞董事长刘庆峰介绍,为了解决大模型应用效率和准确率问题,讯飞星火V3.5提升了对长文本的理解、学习、回答能力,并进行了重要的模型剪枝和蒸馏,从而推出业界最优的130亿参数的大模型。在效果损失仅3%以内的情况下,使得星火在文档上传解析、知识问答的首响时间以及文字生成效率方面都获得了极大的效率提升。
在对比测试中,使用讯飞星火对比国内可测最好的大模型,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本上,星火大模型的性能都是业界最优。
性能极致优化的长文本大模型
在准确率上,本次讯飞星火长文本功能全新升级后,具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力,总体已经达到GPT-4 Turbo 4月最新长文本版本的97%水平。而在银行、保险、汽车、电力等多个垂直领域的知识问答任务上,讯飞星火长文本总体水平已经超过GPT-4 Turbo。
解决了效率和准确率的问题,长文本才能真正落地与应用场景。
挖掘多模态刚需
除了支持长文本,讯飞星火V3.5还率先加入长图文和长语音。
刘庆峰在讯飞星火V3.5春季上新发布会上说,广大用户在知识的获取和学习过程中,往往拿到的资料并不是网上现成的海量长文本,而是随手可见的报刊书籍上的内容。他发问:“能不能用手机一拍就成为我们后台知识的来源?能不能我们参加各种学术研讨会,看到别人的 PPT,上课老师黑板上的板书以及各种同学笔记,都成为我们知识获取和学习的内容?”
目前市面上大多数面向C端提供服务的大模型应用都还不支持图文识别。事实上,图文识别一直是多语言大模型的难点之一。
国际领先的星火图文识别大模型
为解决这一痛点,科大讯飞在深耕图文识别基础上,首发星火图文识别大模型,覆盖书籍、学术论文、报纸、体检报告、PPT等31个工作生活中的常见场景,并针对最常见的18种版面要素进行优化,随手一拍就能向大模型提问,例如页眉、页脚、标题、栏目、段落、表格、插图等要素,甚至还包括比较难但是很实用的公式、印章、二维码、手写材料等。
在英文公开测试集的图文识别效果对比中,星火图文识别大模型已领先微软、Google等国际产品。在诸如科研、金融、产品文档等典型应用场景的图文识别效果对比中,星火图文识别大模型均已实现对GPT-4V的超越。
星火图文识别具有三大优势
在此次升级中,面对广泛的音视频信息高效获取需求,科大讯飞也推出长语音功能,将国际领先的语音识别和翻译技术结合起来,可实现会议录音、学习视频等的一键研读,实现音视频场景的高效知识获取。语音识别一直是科大讯飞的长项,据IDC 去年年中发布的《中国人工智能软件 2022 年市场份额》报告显示,在人工智能语音语义市场,科大讯飞以 11.4% 的市场份额位居行业第一。在语音识别领域最权威的国际多通道语音分离与识别大赛,科大讯飞连续四届斩获第一。
踩实应用阶梯
大模型是否好用,最直观的检验标准就是下载。
据七麦数据,截至目前,讯飞星火APP在安卓端的下载量已经超过9600万次,在国内工具类通用大模型APP中排名第一;讯飞星火APP在苹果App Store上的评论和打分也在国内同行中领先,讯飞星火APP的用户规模稳居行业第一阵营。
星火APP安卓下载量位列
国内工具类通用大模型APP之首
国家互联网信息办公室发布的《生成式人工智能服务已备案信息》显示,截至今年3月,全国已有117家大模型成功备案,讯飞星火是安徽唯一一家。按理说,安徽并非国内技术、人才集聚的第一梯队省份,为何科大讯飞大模型却能够在117家中脱颖而出?
一切答案都指向场景应用。今年,讯飞星火语音大模型,首批37个主流语种的语音识别效果超过OpenAI最新语音大模型Whisper V3。目前,科大讯飞车载智能化产品累计前装超过5700万台,年语音交互次数超100亿次,支撑上汽、奇瑞、比亚迪等10余家车企的60余款车型。2023年中国汽车出海十强企业中,有8家企业都在和科大讯飞合作。今年3月13日,大众集团首款搭载讯飞星火大模型的车型“ID.UNYX”发布(在合肥研发和生产),对比测试效果超过ChatGPT。
医疗领域,讯飞星火中医大模型布局了中医辅助诊疗和健康咨询两大场景,创新性地将中医辅诊功能嵌入智医助理系统,基于大量真实名老中医的诊疗经验和专业知识图谱数据,构建了规模大、覆盖病种全的知识库,包括中医病症知识400+种、穴位知识400+种,常用中草药300+种,古代医案6200+份,传统方剂600+份,现代医案5000+份。
目前,中医智能辅助诊断系统已在华佗故里——亳州上线,覆盖亳州市4个区县,107家基层医疗机构,服务中医师350余名,AI辅助诊断超9800次。同时,该系统还在江苏、湖南、河北等地200+家机构得到应用,助力基层中医药服务能力提升。
更多场景应用,同样正在验证讯飞星火大模型的不断进步。
星火大模型开发者生态蓬勃发展
在讯飞星火APP助手页面,可以看到各式各样的AI助手,有工作场景的,比如 PPT 大纲助手,SWOT 分析助手,周报助手甚至是小红书文案助手;也有服务于编程的,Python、C++、java 等等编程语言应有尽有;趣味性的助手更多了,高情商助手、电影剧情大事、废话文学乃至冷笑话助手。
生活中,讯飞星火的长文本能力不仅可以上传电子合同,还可以实现随手拍纸质合同,一键审核合同漏洞风险。讯飞星火赋能的合同助手,可以实现风险审核、合同比对、摘要总结以及合同生成等功能。生活中遇到纠纷问题,也可以先问问“星火法律咨询”助手,工作中遇到暴力裁员应当如何应对?过年期间劝酒违法吗?这些疑问讯飞星火都能给出专业的法律解答。
星火合同助手
此次讯飞星火V3.5更新版本中,还有一项功能再度加强,即首发多情感超拟人合成功能,进一步提升了合成声音中情绪表达感知能力,情绪可感知度达到85%以上,可以实现包括高兴、抱歉、安慰、撒娇、困惑等多种情感语气表达。除了超拟人对话,科大讯飞还推出“一句话声音复刻”功能,比如模仿小朋友的声音,每天给爷爷奶奶读书读报;在父母出差的时候,模仿自己的声音给孩子讲故事。
多情感超拟人合成首次发布
讯飞星火大模型理解并融合了大量图书知识
正如刘庆峰所说,“技术在不断的进步,我们希望在安全可控的前提下,能够带来这个社会更有温度的人工智能的体验,能够真的帮助到那些特别需要帮助的人。今天这个世界更需要有温度的科技。”
据悉,科大讯飞将在6月27日发布讯飞星火大模型V4.0,进一步“解放生产力,释放想象力”。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】