李逍遥猿-CSDN博客

原创 GPT-4o,AI实时视频通话丝滑如人类，Plus功能免费可用

不开玩笑，电影《她》真的来了。OpenAI最新旗舰大模型，不仅可用，能力更是横跨听、看、说，丝滑流畅毫无延迟，就像在打一个视频电话。现场直播的效果更是炸裂：它能感受到你的呼吸节奏，也能用比以前更丰富的语气实时回复，甚至可以做到随时打断。GPT-4o里的“o”是的缩写，也就是**“全能”**的意思，。它可以在短至232毫秒、平均320毫秒的时间内响应音频输入，。

2024-05-14 22:03:48 1961

原创微软打破Decoder-Only架构！大幅降低GPU内存需求

微软&清华最新研究，打破GPT系列开创的Decoder-Only架构——YOCO，可大幅降低GPU内存需求，且保留全局注意力能力。一张图来看YOCO和标准Transformer的比较。在处理512K上下文长度时，标准Transformer内存使用是YOCO的6.4倍，预填充延迟是YOCO的30.3倍，而YOCO的吞吐量提升到标准Transformer的9.6倍。

2024-05-13 14:16:07 867

原创 GPT搜索鸽了！改升级GPT-4

最近OpenAI太反常，消息一会一变，直让人摸不着头脑。奥特曼最新宣布：5月13日开发布会，，也，改成对ChatGP和GPT-4的升级～消息一出，大伙儿都蒙了。之前大张旗鼓给造势，域名、前端界面都准备好了，甚至已经有用户收到灰度测试。大有在谷歌I/O大会（5月14日）前狙击一把谷歌核心业务的架子，就像春节期间用Sora狙击了谷歌大模型Gemini 1.5一样。再加上路透社啊、彭博社啊这些权威媒体也纷纷收到“消息人士”线报，。总之SearchGPT正把全球科技圈挠的心痒痒，然后突然没下文了？？

2024-05-13 14:13:31 1130

原创国产大模型：100万tokens只需1元！

昨天刚刚在（Invited Talk）中“国内唯一”的大模型玩家，今天又放出了一个好消息：现在我家的大模型开放平台，1元=1000000 tokens！具体而言，这次价格调整的对象，是智谱AI的之前：0.005元 / 千tokens现在：0.001元 / 千tokens换算一下，就是1元=1000000tokens；而同样是百万tokens，ChatGPT的价格是这样的：什么概念呢？相当于花1元钱就能写（以350字计算）。这个大动作，一下子就让智谱AI成为的那一个；！

2024-05-13 14:11:26 4012

原创中国AIGC产业峰会—AI让办公不再孤立，LUI是下一代交互

AIGC果然要将所有软件重塑一遍？中国AIGC产业峰会上，金山办公副总裁、研发中台事业部总经理分享了金山办公拥抱AI的思考与实践。作为一家已成立36年的老牌办公软件公司，金山办公在AI浪潮中将战略重心着重放在了这两点之上。由此，WPS也进行了一波重塑。姚冬在演讲中表示：今天的WPS已不仅是一个文档编辑器。为什么会这样说？为了完整体现姚冬的思考，在不改变原意的基础上，量子位对演讲内容进行了编辑整理，希望能给你带来更多启发。中国AIGC产业峰会是由量子位主办的行业峰会，20位产业代表与会讨论。

2024-05-13 14:00:54 921

原创俄罗斯黑客推出GeoSpy，一眼照片定位到经纬度

有点恐怖。现在，AI只需，就能知道你在哪里，而且是可以精确到经纬度的那种！例如下面这张随便到不能再随便的自拍，你能猜到小姐姐在哪里吗？这事交给现在的AI来处理，它只需要“看”一眼，就能把照片里的**“底裤都给扒出来”**：美国，加利福尼亚州，旧金山机场洗手间，93号登机口附近……坐标：37.6189° N，122.3744° W再如下面这张照片，AI根据湖的特征、树木和背景中的山脉，就匹配到了至于这个AI工具，则是最近由一位俄罗斯黑客所推出，名叫。

2024-05-13 13:58:35 2561

原创缝合Llama3 120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

Llama 3首发阵容里没有的120B型号竟意外“曝光”，而且十分能打？！最近这样一个号称是「」的神秘大模型火了起来，原因在于它表现太出色了——轻松击败GPT-4、gpt2-chatbot那种。比如，面对像「观察希格斯场是否会改变其状态」这样的艰深难题时。GPT-4冷酷而决绝：No；但Llama3-120b就不一样了，“只有当我们质疑量子力学的哥本哈根解释时，让我来解释一下……”

2024-05-13 13:47:34 823

原创自动钓鱼让大模型“发疯”的token，来自Transformer作者创业公司

现在，来自Cohere的研究人员针对这个问题，提出检测“故障”token的有效方法，他们还发现：在多个主流开源大语言模型上，包括Llama系列、Mistral系列在内，训练不足的token都在不同程度上普遍存在。简单来说，由于大模型tokenizer的创建和模型训练是分开的，可能导致某些token在训练中很少、甚至完全没出现过。值得注意的是，论文提到，基于相同tokenizer的模型表现相似，而不同的tokenizer实现、配置、训练数据，会导致不同模型间“训练不足”token的明显差异。

2024-05-13 13:44:44 1111

原创 GPT搜索引擎原型曝光！

OpenAI发布会前一天，……上演大型套娃行为艺术。A：我为B的兴奋感到兴奋；B：我为C的兴奋感到兴奋……Z：我为这些升级感到兴奋与此同时还有小动作不断，比如现在。以及被鸽掉的。黑客“光头哥”Tibor Blaho，从更新的前端代码中扒出的界面。从泄露的界面来看，SearchGPT会出现在侧边栏，与其他GPTs一起。首页目前还很简洁，像谷歌一样只有一个居中的搜索框。甚至非常挑衅的设计了一个“比较”按钮，可以一键打开Google和Perplexity搜索结果，直接与SearchGPT做对比。

2024-05-13 13:41:40 874

原创 6.99元租H800，部署Llama3，羊毛速来薅！

猛然间，大模型圈掀起一股“降价风潮”。前脚，智谱、DeepSeek等大模型厂商将API价格一降再降，输入100万tokens仅需1元。紧接着，GPU租赁的价格也被打了下来。现在潞晨云官方进行限时大额算力补贴，NVIDIA H800的租用价格，低至；NVIDIA A800为，4090甚至低至。不只有租赁服务，平台上还支持快速简易部署Llama 3微调、训练、推理。其中在64卡H100集群上，经过Colossal-AI优化，相比微软+英伟达方案，，推理性能也优于vLLM等方案。

2024-05-13 13:39:25 1899

原创从零开始学AI，人工智能学习路线图

01—

2024-05-09 17:07:24 1444

原创大模型方向好书推荐

我们已经加速进入了大模型的时代。以ChatGPT为首的一些超强模型服务，背后是百亿或千亿参数的基础模型，它们学到了丰富的世界知识，领悟了“与人类打交道”的门路，甚至开始连接和使用外部工具、成为“万物接口”。新的时代有新的机会，与其担心AI将取代我们的工作，不如学会驾驭它！不远的未来，AI大模型或许将是人人可用、人人可开发。本期大牛书单，我们请来了几位鹅厂同事，为大家推荐一些大模型相关的书籍文献和学习资料，一起跟随技术时代的潮流，多读书多进步。

2024-05-08 20:32:35 929

原创 2024年度盘点：AIGC、AGI、GhatGPT、人工智能大模型必读书单

2023年是人工智能大语言模型大爆发的一年，一些概念和英文缩写也在这一年里集中出现，很容易混淆，甚至把人搞懵。**LLM：**Large Language Model，即大语言模型，旨在理解和生成人类语言。LLM的特点是规模庞大，包含成百、上千亿的参数，可以捕捉语言的复杂模式，包括句法、语义和一些上下文信息，从而生成连贯的、有意义的文本。ChatGPT、GPT-4、BERT、文心一言等都是典型的大型语言模型。

2024-05-08 20:30:07 2323

原创金融行业AI大模型百项应用案例综述【大模型系列】

逐浪金融大模型的玩家，除了BAT、华为等高科技巨头，试图以技术优势充当产业链的“卖铲人”，更多的还是金融和类金融企业，包括银行、保险、互金、券商等，既不想被喧宾夺主，又不想肥水外流，都在押注自己的大模型。国内布局金融大模型的机构与国外类似，主要是金融资讯公司如同花顺、金融科技公司如恒生和传统券商等金融机构。智能客服、智能投研、智能运营、数字员工、AI助手是最常见的主要应用方向。这其中银行系，尤其是国有大行，先行一步。

2024-05-05 22:45:00 5323

原创揭秘大模型应用如何成为当红顶流？

Kimi广告神话背后的关键词战略如果你生活在中国，你可能不认识ChatGPT，但你一定知道Kimi。无论是学生党还是打工人，都无法避开Kimi的广告。刘同学在B站上搜教学视频时，弹出了一则软广，上面写着：“作业有问题，直接问Kimi”。每天5G冲浪的小王，在刷段子的空闲时间里看到了一个应用推荐：“Kimi智能助手，帮你实时了解网络热梗。”就连夏倩（化名）也发现了她想要吐槽视频下方引起注意的一行字：“万万不能让导师发现的论文神器！！Kimi智能助手，一键生成论文”。

2024-05-05 22:45:00 1334

原创探索大模型应用：构建基于检索的RAG实战指南

4. Prompt模板构建构建一个符合中文对话语境的Prompt模板，用于生成问题并提供已知信息。

2024-05-05 22:30:00 1947

原创六款大模型应用开发常用工具库

封面图片由通义万相生成毫无疑问的明星库，几乎每一个大模型在发布时都会提供该库的推演支持。Transformer原本是由Google的工程师提出的一种深度学习模型结构的名字，该结构使用了注意力机制，有效的提升了模型表现。HuggingFace将自己开发的注意力机制库命名为Transformers，并逐渐在大语言模型开发中流行开来。Transformers支持Rust。将以下内容添加至Cargo.toml文件官网：https://github.com/huggingface/transformers。

2024-05-05 22:15:00 1697

原创 2024北京市人工智能大模型行业应用分析报告

北京市委市政府高度重视人工智能发展,2023年5月,北京市政府印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》,强调构建高效协同的大模型技术产业生态,建设大模型算法及工具开源开放平台,构建完整大模型技术创新体系。北京市政府办公厅印发《北京市促进通用人工智能创新发展的若干措施》,强调开展大模型创新算法及关键技术研究、加强大模型训练数据采集及治理工具研发,推动大模型在政务、医疗、科学研究、金融等领域的示范应用。截至目前,全市人工智能相关企业约2200家,约占全国四成;

2024-05-05 22:00:00 1215

原创 AI大模型的三大应用场景

过去，人工智能往往局限于特定领域，而大模型凭借其强大的规模扩展性和多任务适应性，打破了这些壁垒，推动人工智能进入新的发展范式。大模型技术引领的新范式，正在推动人工智能走向“通才”，并加速其与各个行业的深度融合，催生众多创新应用场景，推动众多传统行业走向人工智能+。4月27日，中国信通院人工智能研究所副所长魏凯在“算力中关村”技术成果对接交流专场活动上发表《人工智能+的广阔前景与落地之路》的主题演讲。

2024-05-05 19:37:04 1800

原创辩证看待“幻觉”问题，蔚来汽车在 AI 和大模型领域的应用实践

随着新能源汽车大战进入“智能化”的下半场，受政策、技术、市场的驱动，车企竞相踏入 AI 大模型这片蓝海。就在几天前，蔚来自研的 NOMI GPT 端云多模态大模型也正式上线。作为中国高端纯电动汽车市场的引领者，蔚来在人工智能领域是如何布局的？目前 AI 大模型应用已经在哪些场景落地？在研发过程遇到了哪些挑战、又将继续深耕哪些细分领域？在日前举办的“人工智能 X 金融科技创新大会”上，蔚来汽车用户数字产品算法专家兼副总监潘鹏举回答了这些问题，并分享了自己对 AI 大模型架构、大模型发展难题的见解。

2024-05-05 17:54:56 1528

原创大模型在医学上的应用和思考

大模型正在革命性的重塑制药这个行业，将传统药物长达10年的研发周期缩短到几个月。‍‍‍多模态大模型(visual-languange)在临床上的应用可以有效提高临床医生的效率，是一个有前景的技术路径。大模型应用在实际临床上面对的困难：1）不可解释性；2）训练模型的过程中引入的偏见；3）将AI集成到临床点护理中也是一个时间消耗巨大的过程。‍‍‍‍‍‍‍‍‍‍大模型训练在医学应用上的未来发展趋势：通用医学AI（GMAI）。GMAI模型将能够使用极少量或无需特定任务的标记数据来执行多种任务。‍‍。

2024-05-05 17:33:19 1259 1

原创具有惊人 480B 参数的开源企业级大型语言模型

Snowflake AI Research 推出了 Arctic，这是一款专为企业 AI 应用程序设计的尖端开源大型语言模型（LLM），为成本效益和可访问性设定了新标准。该模型利用独特的 Dense-MoE 混合转换器架构来有效地处理 SQL 生成、编码和遵循指令。凭借其在较低计算预算下运行的能力，Arctic 为希望集成高级 AI 的企业提供了高性能解决方案，而无需通常涉及大量成本。

2024-05-04 10:30:00 1241

原创如何运行自己的本地 LLM：2024 年更新了 8 个新的开源工具！

链接：https://huggingface.co/meta-llama。

2024-05-03 11:00:00 2737

原创 Microsoft 推出了迄今为止最小的 AI 模型 Phi-3-mini：它与大型模型的比较

Phi-3-Mini被认为是Microsoft计划发布的三款小型机型中的首款。据报道，在语言、推理、编码和数学等领域，它在各种基准测试中的表现优于相同大小和下一个尺寸的模型。从本质上讲，语言模型是 ChatGPT、Claude、Gemini 等 AI 应用程序的支柱。这些模型在现有数据上进行训练，以解决常见的语言问题，例如文本分类、回答问题、文本生成、文档摘要等。LLM 中的“大”有两个含义——训练数据的巨大规模;和参数计数。

2024-05-02 11:15:00 5086

原创人工智能的未来？RAG 结合了语言和搜索

随着专家们暗示大型语言模型（LLM）的技术极限即将到来，人们的焦点转向了检索增强生成（RAG）——这是一项很有前途的进步，可以通过将信息检索与自然语言生成相结合来重新定义人工智能（AI）。LLM引领了人工智能技术，并改进了各种应用。然而，他们产生虚假信息的倾向限制了他们的潜力。RAG 允许 AI 访问特定的外部数据并将其纳入其响应中，使其更加有效和准确。

2024-05-01 10:00:00 1164

原创国产多模态大模型开源！性能超Claude 3 Sonnet

在当今快速发展的人工智能领域，国产技术正不断取得突破性进展。最近，由元象公司推出的XVERSE-V多模态大模型，以其卓越的性能和开放的商业模式，引起了业界的广泛关注。

2024-04-29 16:57:26 1236

原创 AIGC视频技术的商业化之路

随着AIGC技术的不断进步，中国企业如魔珐科技正在探索新的发展路径，通过产品化和商业化策略，实现技术的规模化应用。有言平台的成功案例表明，以用户为中心，提供高效、可控、低成本的视频创作解决方案，是实现AIGC技术商业化的关键。随着技术的进一步发展，我们有理由相信，AIGC将为内容创作带来更深远的影响。

2024-04-29 16:41:33 999

原创逝世： AI意识先驱：Daniel Dennett

认知科学和哲学的巨人、塔夫茨大学名誉教授（Daniel Dennett）逝世了，享年82岁。丹尼特在哲学领域做出了重大的贡献，被称为**“进化论四骑士”**之一，是近二十年来西方新无神论运动的领军人物。他的巨作**《意识的解释》**被认为是心智哲学甚至当代哲学中最重要的著作之一，全方位地对意识现象做了探索。而他对于“意识”独树一帜的见解，正是源自他与和颇深的渊源，广泛吸收了来自神经科学、心理学、人工智能等领域的信息。与此同时，他的思想和言论也深刻地影响着人们对人工智能、意识和思想的理解。

2024-04-25 13:47:30 940

原创多模态大模型自动分析网页海报内容，打工人简直不要太方便

一个可以自动分析PDF、网页、海报、Excel图表内容的大模型，对于打工人来说简直不要太方便。上海AI Lab，香港中文大学等研究机构提出的InternLM-XComposer2-4KHD（简写为IXC2-4KHD）模型让这成为了现实。相比于其他多模态大模型不超过1500x1500的分辨率限制，该工作将多模态大模型的最大输入图像提升到超过4K （3840 x1600）分辨率，并支持任意长宽比和336像素～4K动态分辨率变化。发布三天，该模型就登顶Hugging Face视觉问答模型热度榜单第一。

2024-04-24 19:05:42 1207

原创终端侧生成式AI时代已经来临｜中国AIGC产业峰会

2015年及更早之前，AI主要用于一些比较简单的图像识别、图像分类用例，所以我们给NPU配置了标量和向量加速器。2016—2022年间，计算摄影概念开始流行，我们把研究方向从图像分类转移到了AI计算摄影及视频等等，包括对自然语言理解和处理的支持，以及对Transformer模型的支持，我们给NPU硬件在标量和向量加速器的基础之上，增加了张量加速器。2023年，大模型热度很高，我们在业内率先完成了端侧的大模型支持，给NPU配置了专门的Transformer加速模块。

2024-04-24 18:59:09 1289

原创 GPT-4化身黑客搞破坏，成功率87%！

91行代码、1056个token，GPT-4化身黑客搞破坏！测试成功率达87%，单次成本仅（折合人民币约63元）。这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架，研究了包括GPT-4、GPT-3.5和众多开源模型在内的10个模型。结果发现只有GPT-4能够在阅读CVE漏洞描述后，学会利用漏洞攻击，而其它模型成功率为0。研究人员表示，OpenAI已要求他们不要向公众发布该研究的提示词。网友们立马赶来围观了，有人还搞起了复现。这是怎么一回事？

2024-04-24 18:53:10 597

原创 AI如何升级你的“第二大脑”

百模大战之后，大伙儿或许有个共识：现在不缺大模型，缺的是怎么更好地把大模型用起来的方法。有个现成的例子是，一直被很多知识工作者当成自己的“第二大脑”来用，在AIGC时代，用户看到了它更智能的改变。其实早在2018年，印象笔记就在AIGC的领域里开启了自己的摸爬滚打，几年下来，积累了不少经验和思考。在本次中国AIGC产业峰会上，从知识管理的角度，分享了印象笔记在AIGC领域，从技术到应用和产品的所见所闻、所思所感。

2024-04-24 18:50:54 1129

原创新测试基准发布，最强开源Llama 3尴尬了

如果试题太简单，学霸和学渣都能考90分，拉不开差距……随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布，业界急需一款。大模型竞技场背后组织LMSYS推出下一代基准测试，引起广泛关注。Llama 3的两个指令微调版本实力到底如何，也有了最新参考。与之前大家分数都相近的MT Bench相比，Arena-Hard，孰强孰弱一目了然。Arena-Hard利用竞技场实时人类数据构建，。

2024-04-24 18:47:26 1584

原创 Llama 3测试结果新鲜出炉，Llama 3位列第五，GTP-4-Turbo第一

关于Llama 3，又有测试结果新鲜出炉——大模型评测社区LMSYS发布了一份大模型排行榜单，Llama 3位列第五，英文单项与GPT-4并列第一。不同于其他Benchmark，这份榜单的依据是模型一对一battle，由全网测评者自行命题并打分。最终，Llama 3取得了榜单中的第五名，排在前面的是GPT-4的三个不同版本，以及Claude 3超大杯Opus。而在英文单项榜单中，Llama 3反超了Claude，与GPT-4打成了平手。

2024-04-24 16:30:00 1398

原创微软退出手机能跑的大模型，性能赶超Llama-3

Llama 3发布刚几天，微软就出手截胡了？今天发布的技术报告，引起AI圈热议。其中仅在多项基准测试中。为了方便开源社区使用，还特意设计成了与Llama系列兼容的结构。微软这次打出“手机就能直接跑的小模型”的旗号，4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的上跑到每秒12 token。这意味着，现在手机上能本地运行的最佳开源模型，已经做到ChatGPT水平。

2024-04-24 09:22:14 1194

原创 Llama 3 干翻GPT-4，Meta打了闭源大厂的脸

不知道李彦宏现在心情如何。就在他公开表示 “ 开源模型会越来越落后 ” 的 3 天后，活菩萨小扎慢悠悠地登场了。丝毫不给面子，以一己之力掀翻了桌子。就在今天凌晨， Meta 正式发布了全新的 Llama 3 模型，还一次上新了 8B 和 70B 两个参数版本。它的训练数据集比 Llama 2 整整大了 7 倍，达到了 15T ，容量也是上一代的两倍，支持 8K 上下文长度。目前，它们已经接入了 Meta 最新发布的智能助手 Meta AI 中，

2024-04-23 18:22:15 1315

2401_84587944的博客