自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 GPT-4o,AI实时视频通话丝滑如人类,Plus功能免费可用

不开玩笑,电影《她》真的来了。OpenAI最新旗舰大模型,不仅可用,能力更是横跨听、看、说,丝滑流畅毫无延迟,就像在打一个视频电话。现场直播的效果更是炸裂:它能感受到你的呼吸节奏,也能用比以前更丰富的语气实时回复,甚至可以做到随时打断。GPT-4o里的“o”是的缩写,也就是**“全能”**的意思,。它可以在短至232毫秒、平均320毫秒的时间内响应音频输入,。

2024-05-14 22:03:48 1037

原创 微软打破Decoder-Only架构!大幅降低GPU内存需求

微软&清华最新研究,打破GPT系列开创的Decoder-Only架构——YOCO,可大幅降低GPU内存需求,且保留全局注意力能力。一张图来看YOCO和标准Transformer的比较。在处理512K上下文长度时,标准Transformer内存使用是YOCO的6.4倍,预填充延迟是YOCO的30.3倍,而YOCO的吞吐量提升到标准Transformer的9.6倍。

2024-05-13 14:16:07 558

原创 GPT搜索鸽了!改升级GPT-4

最近OpenAI太反常,消息一会一变,直让人摸不着头脑。奥特曼最新宣布:5月13日开发布会,,也,改成对ChatGP和GPT-4的升级~消息一出,大伙儿都蒙了。之前大张旗鼓给造势,域名、前端界面都准备好了,甚至已经有用户收到灰度测试。大有在谷歌I/O大会(5月14日)前狙击一把谷歌核心业务的架子,就像春节期间用Sora狙击了谷歌大模型Gemini 1.5一样。再加上路透社啊、彭博社啊这些权威媒体也纷纷收到“消息人士”线报,。总之SearchGPT正把全球科技圈挠的心痒痒,然后突然没下文了??

2024-05-13 14:13:31 874

原创 国产大模型:100万tokens只需1元!

昨天刚刚在(Invited Talk)中“国内唯一”的大模型玩家,今天又放出了一个好消息:现在我家的大模型开放平台,1元=1000000 tokens!具体而言,这次价格调整的对象,是智谱AI的之前:0.005元 / 千tokens现在:0.001元 / 千tokens换算一下,就是1元=1000000tokens;而同样是百万tokens,ChatGPT的价格是这样的:什么概念呢?相当于花1元钱就能写(以350字计算)。这个大动作,一下子就让智谱AI成为的那一个;!

2024-05-13 14:11:26 585

原创 中国AIGC产业峰会—AI让办公不再孤立,LUI是下一代交互

AIGC果然要将所有软件重塑一遍?中国AIGC产业峰会上,金山办公副总裁、研发中台事业部总经理分享了金山办公拥抱AI的思考与实践。作为一家已成立36年的老牌办公软件公司,金山办公在AI浪潮中将战略重心着重放在了这两点之上。由此,WPS也进行了一波重塑。姚冬在演讲中表示:今天的WPS已不仅是一个文档编辑器。为什么会这样说?为了完整体现姚冬的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。中国AIGC产业峰会是由量子位主办的行业峰会,20位产业代表与会讨论。

2024-05-13 14:00:54 547

原创 俄罗斯黑客推出GeoSpy,一眼照片定位到经纬度

有点恐怖。现在,AI只需,就能知道你在哪里,而且是可以精确到经纬度的那种!例如下面这张随便到不能再随便的自拍,你能猜到小姐姐在哪里吗?这事交给现在的AI来处理,它只需要“看”一眼,就能把照片里的**“底裤都给扒出来”**:美国,加利福尼亚州,旧金山机场洗手间,93号登机口附近……坐标:37.6189° N,122.3744° W再如下面这张照片,AI根据湖的特征、树木和背景中的山脉,就匹配到了至于这个AI工具,则是最近由一位俄罗斯黑客所推出,名叫。

2024-05-13 13:58:35 1036

原创 缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

Llama 3首发阵容里没有的120B型号竟意外“曝光”,而且十分能打?!最近这样一个号称是「」的神秘大模型火了起来,原因在于它表现太出色了——轻松击败GPT-4、gpt2-chatbot那种。比如,面对像「观察希格斯场是否会改变其状态」这样的艰深难题时。GPT-4冷酷而决绝:No;但Llama3-120b就不一样了,“只有当我们质疑量子力学的哥本哈根解释时,让我来解释一下……”

2024-05-13 13:47:34 610

原创 自动钓鱼让大模型“发疯”的token,来自Transformer作者创业公司

现在,来自Cohere的研究人员针对这个问题,提出检测“故障”token的有效方法,他们还发现:在多个主流开源大语言模型上,包括Llama系列、Mistral系列在内,训练不足的token都在不同程度上普遍存在。简单来说,由于大模型tokenizer的创建和模型训练是分开的,可能导致某些token在训练中很少、甚至完全没出现过。值得注意的是,论文提到,基于相同tokenizer的模型表现相似,而不同的tokenizer实现、配置、训练数据,会导致不同模型间“训练不足”token的明显差异。

2024-05-13 13:44:44 866

原创 GPT搜索引擎原型曝光!

OpenAI发布会前一天,……上演大型套娃行为艺术。A:我为B的兴奋感到兴奋;B:我为C的兴奋感到兴奋……Z:我为这些升级感到兴奋与此同时还有小动作不断,比如现在。以及被鸽掉的。黑客“光头哥”Tibor Blaho,从更新的前端代码中扒出的界面。从泄露的界面来看,SearchGPT会出现在侧边栏,与其他GPTs一起。首页目前还很简洁,像谷歌一样只有一个居中的搜索框。甚至非常挑衅的设计了一个“比较”按钮,可以一键打开Google和Perplexity搜索结果,直接与SearchGPT做对比。

2024-05-13 13:41:40 650

原创 6.99元租H800,部署Llama3,羊毛速来薅!

猛然间,大模型圈掀起一股“降价风潮”。前脚,智谱、DeepSeek等大模型厂商将API价格一降再降,输入100万tokens仅需1元。紧接着,GPU租赁的价格也被打了下来。现在潞晨云官方进行限时大额算力补贴,NVIDIA H800的租用价格,低至;NVIDIA A800为,4090甚至低至。不只有租赁服务,平台上还支持快速简易部署Llama 3微调、训练、推理。其中在64卡H100集群上,经过Colossal-AI优化,相比微软+英伟达方案,,推理性能也优于vLLM等方案。

2024-05-13 13:39:25 1078

原创 从零开始学AI,人工智能学习路线图

01—

2024-05-09 17:07:24 1102

原创 大模型方向好书推荐

我们已经加速进入了大模型的时代。以ChatGPT为首的一些超强模型服务,背后是百亿或千亿参数的基础模型,它们学到了丰富的世界知识,领悟了“与人类打交道”的门路,甚至开始连接和使用外部工具、成为“万物接口”。新的时代有新的机会,与其担心AI将取代我们的工作,不如学会驾驭它!不远的未来,AI大模型或许将是人人可用、人人可开发。本期大牛书单,我们请来了几位鹅厂同事,为大家推荐一些大模型相关的书籍文献和学习资料,一起跟随技术时代的潮流,多读书多进步。

2024-05-08 20:32:35 391

原创 2024年度盘点:AIGC、AGI、GhatGPT、人工智能大模型必读书单

2023年是人工智能大语言模型大爆发的一年,一些概念和英文缩写也在这一年里集中出现,很容易混淆,甚至把人搞懵。**LLM:**Large Language Model,即大语言模型,旨在理解和生成人类语言。LLM的特点是规模庞大,包含成百、上千亿的参数,可以捕捉语言的复杂模式,包括句法、语义和一些上下文信息,从而生成连贯的、有意义的文本。ChatGPT、GPT-4、BERT、文心一言等都是典型的大型语言模型。

2024-05-08 20:30:07 1692

原创 金融行业AI大模型百项应用案例综述【大模型系列】

逐浪金融大模型的玩家,除了BAT、华为等高科技巨头,试图以技术优势充当产业链的“卖铲人”,更多的还是金融和类金融企业,包括银行、保险、互金、券商等,既不想被喧宾夺主,又不想肥水外流,都在押注自己的大模型。国内布局金融大模型的机构与国外类似,主要是金融资讯公司如同花顺、金融科技公司如恒生和传统券商等金融机构。智能客服、智能投研、智能运营、数字员工、AI助手是最常见的主要应用方向。这其中银行系,尤其是国有大行,先行一步。

2024-05-05 22:45:00 2983

原创 揭秘大模型应用如何成为当红顶流?

Kimi广告神话背后的关键词战略如果你生活在中国,你可能不认识ChatGPT,但你一定知道Kimi。无论是学生党还是打工人,都无法避开Kimi的广告。刘同学在B站上搜教学视频时,弹出了一则软广,上面写着:“作业有问题,直接问Kimi”。每天5G冲浪的小王,在刷段子的空闲时间里看到了一个应用推荐:“Kimi智能助手,帮你实时了解网络热梗。”就连夏倩(化名)也发现了她想要吐槽视频下方引起注意的一行字:“万万不能让导师发现的论文神器!!Kimi智能助手,一键生成论文”。

2024-05-05 22:45:00 858

原创 探索大模型应用:构建基于检索的RAG实战指南

4. Prompt模板构建构建一个符合中文对话语境的Prompt模板,用于生成问题并提供已知信息。

2024-05-05 22:30:00 1050

原创 六款大模型应用开发常用工具库

封面图片由通义万相生成毫无疑问的明星库,几乎每一个大模型在发布时都会提供该库的推演支持。Transformer原本是由Google的工程师提出的一种深度学习模型结构的名字,该结构使用了注意力机制,有效的提升了模型表现。HuggingFace将自己开发的注意力机制库命名为Transformers,并逐渐在大语言模型开发中流行开来。Transformers支持Rust。将以下内容添加至Cargo.toml文件官网:https://github.com/huggingface/transformers。

2024-05-05 22:15:00 780

原创 2024北京市人工智能大模型行业应用分析报告

北京市委市政府高度重视人工智能发展,2023年5月,北京市政府印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》,强调构建高效协同的大模型技术产业生态,建设大模型算法及工具开源开放平台,构建完整大模型技术创新体系。北京市政府办公厅印发《北京市促进通用人工智能创新发展的若干措施》,强调开展大模型创新算法及关键技术研究、加强大模型训练数据采集及治理工具研发,推动大模型在政务、医疗、科学研究、金融等领域的示范应用。截至目前,全市人工智能相关企业约2200家,约占全国四成;

2024-05-05 22:00:00 840

原创 AI大模型的三大应用场景

过去,人工智能往往局限于特定领域,而大模型凭借其强大的规模扩展性和多任务适应性,打破了这些壁垒,推动人工智能进入新的发展范式。大模型技术引领的新范式,正在推动人工智能走向“通才”,并加速其与各个行业的深度融合,催生众多创新应用场景,推动众多传统行业走向人工智能+。4月27日,中国信通院人工智能研究所副所长魏凯在“算力中关村”技术成果对接交流专场活动上发表《人工智能+的广阔前景与落地之路》的主题演讲。

2024-05-05 19:37:04 566

原创 辩证看待“幻觉”问题,蔚来汽车在 AI 和大模型领域的应用实践

随着新能源汽车大战进入“智能化”的下半场,受政策、技术、市场的驱动,车企竞相踏入 AI 大模型这片蓝海。就在几天前,蔚来自研的 NOMI GPT 端云多模态大模型也正式上线。作为中国高端纯电动汽车市场的引领者,蔚来在人工智能领域是如何布局的?目前 AI 大模型应用已经在哪些场景落地?在研发过程遇到了哪些挑战、又将继续深耕哪些细分领域?在日前举办的“人工智能 X 金融科技创新大会”上,蔚来汽车用户数字产品算法专家兼副总监潘鹏举回答了这些问题,并分享了自己对 AI 大模型架构、大模型发展难题的见解。

2024-05-05 17:54:56 701

原创 大模型在医学上的应用和思考

大模型正在革命性的重塑制药这个行业,将传统药物长达10年的研发周期缩短到几个月。‍‍‍多模态大模型(visual-languange)在临床上的应用可以有效提高临床医生的效率,是一个有前景的技术路径。大模型应用在实际临床上面对的困难:1)不可解释性;2)训练模型的过程中引入的偏见;3)将AI集成到临床点护理中也是一个时间消耗巨大的过程。‍‍‍‍‍‍‍‍‍‍大模型训练在医学应用上的未来发展趋势:通用医学AI(GMAI)。GMAI模型将能够使用极少量或无需特定任务的标记数据来执行多种任务。‍‍。

2024-05-05 17:33:19 640 1

原创 具有惊人 480B 参数的开源企业级大型语言模型

Snowflake AI Research 推出了 Arctic,这是一款专为企业 AI 应用程序设计的尖端开源大型语言模型 (LLM),为成本效益和可访问性设定了新标准。该模型利用独特的 Dense-MoE 混合转换器架构来有效地处理 SQL 生成、编码和遵循指令。凭借其在较低计算预算下运行的能力,Arctic 为希望集成高级 AI 的企业提供了高性能解决方案,而无需通常涉及大量成本。

2024-05-04 10:30:00 908

原创 如何运行自己的本地 LLM:2024 年更新了 8 个新的开源工具!

链接:https://huggingface.co/meta-llama。

2024-05-03 11:00:00 857

原创 Microsoft 推出了迄今为止最小的 AI 模型 Phi-3-mini:它与大型模型的比较

Phi-3-Mini被认为是Microsoft计划发布的三款小型机型中的首款。据报道,在语言、推理、编码和数学等领域,它在各种基准测试中的表现优于相同大小和下一个尺寸的模型。从本质上讲,语言模型是 ChatGPT、Claude、Gemini 等 AI 应用程序的支柱。这些模型在现有数据上进行训练,以解决常见的语言问题,例如文本分类、回答问题、文本生成、文档摘要等。LLM 中的“大”有两个含义——训练数据的巨大规模;和参数计数。

2024-05-02 11:15:00 3130

原创 人工智能的未来?RAG 结合了语言和搜索

随着专家们暗示大型语言模型(LLM)的技术极限即将到来,人们的焦点转向了检索增强生成(RAG)——这是一项很有前途的进步,可以通过将信息检索与自然语言生成相结合来重新定义人工智能(AI)。LLM引领了人工智能技术,并改进了各种应用。然而,他们产生虚假信息的倾向限制了他们的潜力。RAG 允许 AI 访问特定的外部数据并将其纳入其响应中,使其更加有效和准确。

2024-05-01 10:00:00 988

原创 国产多模态 大模型 开源!性能超Claude 3 Sonnet

在当今快速发展的人工智能领域,国产技术正不断取得突破性进展。最近,由元象公司推出的XVERSE-V多模态大模型,以其卓越的性能和开放的商业模式,引起了业界的广泛关注。

2024-04-29 16:57:26 692

原创 AIGC视频技术的商业化之路

随着AIGC技术的不断进步,中国企业如魔珐科技正在探索新的发展路径,通过产品化和商业化策略,实现技术的规模化应用。有言平台的成功案例表明,以用户为中心,提供高效、可控、低成本的视频创作解决方案,是实现AIGC技术商业化的关键。随着技术的进一步发展,我们有理由相信,AIGC将为内容创作带来更深远的影响。

2024-04-29 16:41:33 560

原创 逝世 : AI意识先驱:Daniel Dennett

认知科学和哲学的巨人、塔夫茨大学名誉教授(Daniel Dennett)逝世了,享年82岁。丹尼特在哲学领域做出了重大的贡献,被称为**“进化论四骑士”**之一,是近二十年来西方新无神论运动的领军人物。他的巨作**《意识的解释》**被认为是心智哲学甚至当代哲学中最重要的著作之一,全方位地对意识现象做了探索。而他对于“意识”独树一帜的见解,正是源自他与和颇深的渊源,广泛吸收了来自神经科学、心理学、人工智能等领域的信息。与此同时,他的思想和言论也深刻地影响着人们对人工智能、意识和思想的理解。

2024-04-25 13:47:30 565

原创 多模态大模型 自动分析网页海报内容,打工人简直不要太方便

一个可以自动分析PDF、网页、海报、Excel图表内容的大模型,对于打工人来说简直不要太方便。上海AI Lab,香港中文大学等研究机构提出的InternLM-XComposer2-4KHD(简写为IXC2-4KHD)模型让这成为了现实。相比于其他多模态大模型不超过1500x1500的分辨率限制,该工作将多模态大模型的最大输入图像提升到超过4K (3840 x1600)分辨率,并支持任意长宽比和336像素~4K动态分辨率变化。发布三天,该模型就登顶Hugging Face视觉问答模型热度榜单第一。

2024-04-24 19:05:42 635

原创 终端侧生成式AI时代已经来临|中国AIGC产业峰会

2015年及更早之前,AI主要用于一些比较简单的图像识别、图像分类用例,所以我们给NPU配置了标量和向量加速器。2016—2022年间,计算摄影概念开始流行,我们把研究方向从图像分类转移到了AI计算摄影及视频等等,包括对自然语言理解和处理的支持,以及对Transformer模型的支持,我们给NPU硬件在标量和向量加速器的基础之上,增加了张量加速器。2023年,大模型热度很高,我们在业内率先完成了端侧的大模型支持,给NPU配置了专门的Transformer加速模块。

2024-04-24 18:59:09 965

原创 GPT-4化身黑客搞破坏,成功率87%!

91行代码、1056个token,GPT-4化身黑客搞破坏!测试成功率达87%,单次成本仅(折合人民币约63元)。这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模型在内的10个模型。结果发现只有GPT-4能够在阅读CVE漏洞描述后,学会利用漏洞攻击,而其它模型成功率为0。研究人员表示,OpenAI已要求他们不要向公众发布该研究的提示词。网友们立马赶来围观了,有人还搞起了复现。这是怎么一回事?

2024-04-24 18:53:10 420

原创 AI如何升级你的“第二大脑”

百模大战之后,大伙儿或许有个共识:现在不缺大模型,缺的是怎么更好地把大模型用起来的方法。有个现成的例子是,一直被很多知识工作者当成自己的“第二大脑”来用,在AIGC时代,用户看到了它更智能的改变。其实早在2018年,印象笔记就在AIGC的领域里开启了自己的摸爬滚打,几年下来,积累了不少经验和思考。在本次中国AIGC产业峰会上,从知识管理的角度,分享了印象笔记在AIGC领域,从技术到应用和产品的所见所闻、所思所感。

2024-04-24 18:50:54 756

原创 新测试基准发布,最强开源Llama 3尴尬了

如果试题太简单,学霸和学渣都能考90分,拉不开差距……随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款。大模型竞技场背后组织LMSYS推出下一代基准测试,引起广泛关注。Llama 3的两个指令微调版本实力到底如何,也有了最新参考。与之前大家分数都相近的MT Bench相比,Arena-Hard,孰强孰弱一目了然。Arena-Hard利用竞技场实时人类数据构建,。

2024-04-24 18:47:26 1025

原创 Llama 3测试结果新鲜出炉,Llama 3位列第五,GTP-4-Turbo第一

关于Llama 3,又有测试结果新鲜出炉——大模型评测社区LMSYS发布了一份大模型排行榜单,Llama 3位列第五,英文单项与GPT-4并列第一。不同于其他Benchmark,这份榜单的依据是模型一对一battle,由全网测评者自行命题并打分。最终,Llama 3取得了榜单中的第五名,排在前面的是GPT-4的三个不同版本,以及Claude 3超大杯Opus。而在英文单项榜单中,Llama 3反超了Claude,与GPT-4打成了平手。

2024-04-24 16:30:00 1026

原创 微软退出手机能跑的大模型,性能赶超Llama-3

Llama 3发布刚几天,微软就出手截胡了?今天发布的技术报告,引起AI圈热议。其中仅在多项基准测试中。为了方便开源社区使用,还特意设计成了与Llama系列兼容的结构。微软这次打出“手机就能直接跑的小模型”的旗号,4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的上跑到每秒12 token。这意味着,现在手机上能本地运行的最佳开源模型,已经做到ChatGPT水平。

2024-04-24 09:22:14 918

原创 Llama 3 干翻GPT-4,Meta打了闭源大厂的脸

不知道李彦宏现在心情如何。就在他公开表示 “ 开源模型会越来越落后 ” 的 3 天后,活菩萨小扎慢悠悠地登场了。丝毫不给面子,以一己之力掀翻了桌子。就在今天凌晨, Meta 正式发布了全新的 Llama 3 模型,还一次上新了 8B 和 70B 两个参数版本。它的训练数据集比 Llama 2 整整大了 7 倍,达到了 15T ,容量也是上一代的两倍,支持 8K 上下文长度。目前,它们已经接入了 Meta 最新发布的智能助手 Meta AI 中,

2024-04-23 18:22:15 1056

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除