最完整的全球生成式AI生态地图;900+LLM开源工具清单与我的观察;我开发了Devin平替,6个月的血泪经验;月之暗面新一轮内测 | ShowMeAI日报

国内外大模型近期进展汇总:乱花渐欲迷人眼

🔔 月之暗面

img

3月18日,月之暗面 (Moonshot AI) 宣布启动 200 万字无损上下文 内测,几十万字的经典德州扑克长篇教程、近百万字中医诊疗手册、上市公司的所有完整财报、代码仓库里的源代码…… Kimi 都能轻松拿捏~

网站首页第一条,点击就会弹出预约框,快来一起排队吧 ⋙ 官方发布 | 申请内测

🔔 Grok

3月18日,Elon Musk (马斯克) 如约开源其 x.ai 公司的大模型 Grok,模型参数 314B (3140 亿,目前最大的),模型架构也是 MoE,而且是在深度学习框架 JAX 上用 Rust 编程语言从头搭建并训练的。采用 Apache 2.0 license 协议,对商用友好。

如果你想部署这个大模型,那大概需要 58 块 H100 🤪 这个巨无霸对普通用户的硬件设备可不算友好 ⋙ 了解更多 | 官方网站

🔔 零一万物

零一万物最近非常活跃。3月17日 ⋙ 开放笛卡尔 (Descartes) 向量数据库搜索内核,免费商用,3月6日 ⋙ 发布并开源 Yi-9B,代码和数学能力出色,综合实力强劲 | 官方网站

尤其需要注意的是,零一万物正式发布了 Yi 大模型 API 开放平台 👆,并且提供 Yi-34B-Chat-0205、Yi-34B-Chat-200K、Yi-VL-Plus 等模型。新用户注册即赠送 60 元,朋友们记得薅一下 🎁 | API开放平台

🔔 讯飞智文

3月14日,讯飞开放了一个新的 AIGC 工具「讯飞智文」,可以基于大模型一键生成Word、PPT 文档。注册即可使用,效果算是OK能用的水平 (大多数 PPT 生成类产品都在这个水平线) ⋙ 官方发布 | 官方网站

🔔 DeepSeekVL

3月11日,幻方旗下 DeepSeek 发布多模态大模型「DeepSeekVL」,即通用视觉语言理解模型,包含 7B、1.3B 两个版本。

据说效果超越了同规模(7B 参数)的 EMU2-Chat / Yi-VL 等模型,甚至超过更大规模(17B 参数)的 CogVLM ⋙ 官方发布 | GitHub

🔔 爱诗视频大模型

3月11日,爱诗科技宣布完成亿级人民币的A1轮融资,并开放国内版「爱诗视频大模型」的内测。👆 点击上方链接申请参与内测。

PixVerse 是其海外版产品,已经于2024年1月上线发布,效果还是挺不错的!所以,国内版的内测,朋友们要积极一点哇~ ⋙ 官方发布 | 申请内测

🉑 a16z 发布最受欢迎的 100 个 GenAI 应用:风起云涌,瞬息万变

a16z (全称Andreessen Horowitz) 是一家知名的美国风投公司,发布的AI行业观察的质量都非常高。上周,a16z 发布了最新的报告,统计了截止2024年1月最受欢迎的 GenAI (生成式人工智能) 应用,包含 Web 端 TOP50 & 移动端 TOP50。

img

img

↑ Web端数据来源:SimilarWeb (截至2024年1月)

img

img

↑ 移动端数据来源:Sensor Tower (截至2024年1月)

a16z.com/100-gen-ai-…

原文对这100个应用进行了各种维度的分析,并与去年9月份的排名进行了对比。以下是一些核心数据分析结果:

img

1. 进步的速度:六个月内有22个新成员

  • ChatGPT 月度网络访问量接近20亿,是排名第二的 Bard (现更名为Gemini) 的5倍左右。
  • 在过去的六个月中,有 22 家公司新进入网络流量排名 👆如上图,表明AI领域正在快速发展,新企业正在不断涌现。

2. 新类别的出现:音乐、生产力工具

  • 音乐 & 生产力工具,是AI应用中的2个新兴类别,其中 Suno 是唯一一个上榜的音乐公司。
  • 生产力工具类别包括 Liner、Eightify、Phind、MaxAI、Blackbox AI、Otter.ai 和 ChatPDF。

3. AI伴侣关系迎来增长高峰

  • AI伴侣已成为一个主流AI分类,从两个月前的2家公司增长到现在的8家。
  • 用户对标榜「没有审查」的AI陪伴应用更为喜爱,并且在移动应用里异常活跃度,甚至已经成为了日常生活的一部分

4. 网络端与移动端差异的背后原因

  • 网络产品更倾向于支持复杂的多步骤工作流程产品;移动应用的使用则倾向于通用助手,并且可以在应用商店中通过优化和广告迅速获得优势。

img

此外,原文有一个观察和总结非常有趣,指出 Discord 社区已经成为了AI产品的试练场——开发者在 Discord 里可以快速构建并验证产品 (省了很多开发工作),获得用户基础和反馈后再发展成为独立的产品

上图中的AI产品都诞生自 Discord,并且快速攀升到了 Discord 服务器的前 100 名,其中就包括我们熟知的 Midjourney、Suno、Pika 等。

🉑 2024 全球生成式AI生态地图:那些已经取得突破的国家和公司

img

www.blog.aiport.tech/p/the-first…

高清图&高清PDF文档,前往星球(或社群)获取

这应该是第一份真正意义上的「全球生成式AI生态地图 (Global Generative AI Landscape 2024)」,整理了在 GenAI 领域取得突破性进展的国家和公司,并进行了统计分类。

1. GenAI 解决方案的类型 (10类):文本,音频,视频,聊天机器人,图像,游戏,商业智能,代码,3D渲染、多模态

2. 按照地理位置分类

  • 北美洲:38家公司
  • 欧洲:17个国家 (排名靠前的包括英国、法国、德国、荷兰、奥地利和俄罗斯等),27家公司
  • 亚洲:11个国家 (排名靠前的包括以色列、中国、印度、新加坡和日本等),28家公司
  • 非洲/大洋洲/南美洲:5个国家 (肯尼亚、南非、新西兰、澳大利亚、阿根廷),8家公司

3. 按照公司包含的模型类别

  • 5种:Stability AI (图像,视频,音频,3D,代码)
  • 4种:OpenAI (聊天机器人,音频,视频,多模态),Google (文本,图像,音频,多模态)
  • 3种:Microsoft、Meta、Tencent (腾讯)、Baidu (百度)、Yandex

4. 单一类别内开发多个模型的公司:

  • AssemblyAI: 拥有两个语音转文本模型
  • MosaicML: 提供了两个版本的MPT,用于代码生成
  • IPOXCap: 推出了两个为商业智能应用设计的聊天机器人

5. 实现多模态的公司:

  • 大约10%的公司在其GenAI模型中实现了多模态功能,这意味着这些模型能够同时处理和理解多种类型的数据输入,如文本、图像、音频和视频。
  • 大多数实现多模态的公司位于美国,其中北美有8个多模态模型,而欧洲只有2个。

原文提到的 Global AI index,是英国传媒机构 Tortoise Media 在2023年发布的一项全球AI指数排名,一共包含62个国家,感兴趣可以前往下方网站查看详情 👇

www.tortoisemedia.com/intelligenc…

🉑 QuestMobile 2024 生成式人工智能 (AIGC) App 应用洞察报告

国外喜欢用「生成式人工智能 (GenAI)」,咱国内更习惯的表达是「AIGC」。QuestMobile 最近发布了一份国内 GenAI / AIGC App 应用的数据分析报告,展示了头部 App 的增长情况、月活数据、用户画像等关键内容。

节选几张关键图表和数据解释,感兴趣可以 ⋙ 阅读原文

img

用户对 AIGC 报以极大热情,独立App的需求持续增长,TOP10 App去重用户规模同比增长37倍。

img

头部 AIGC App的聚合用户多为男性,年龄集中在25-45岁,位于三线及以上城市,同时具备较高消费意愿与消费能力。

img

img

现阶段头部应用普遍聚焦在文本和图像信息模态生成;豆包、文心一言以千万月活的用户规模“领跑”,其次是天工、扮伴-AI绘画及讯飞星火。

但需要主义的是,用户的活跃率低 (均低于 20%),忠诚度低 (3日留存均低于 50%),流失风险高 (部分卸载率超过 50%)。

img

img

各大内容平台上开始出现 AIGC 内容,包括通过AI创作的高质量文章、图片、短视频等,形成社区效应和自发性流量增长。在这些平台 AIGC 内容里,用户更喜欢金融财经、企业、二次元、科技科普等主题的内容

🉑 我收集了 900 多个开源 GenAI / GPT / LLM 工具,然后进行了一番研究

img

huyenchip.com/llama-polic…

这是一份LLM开源项目清单,目前包含 937 个项目,而且还在以每天4次的频率更新中 (每6个小时更新一次)。表单支持搜索和分类查找,感兴趣可以收藏~

huyenchip.com/2024/03/14/…

这份表单的作者,在 👆 这篇文章里介绍了数据来源,即通过 GitHub 搜索关键词gpt、llm和generative ai,然后筛选出超过 500 Star 的仓库。

作者对这 900 多个开源工具进行了非常多维度的分析,有很多有趣的细节。以下是分析要点,感兴趣可以阅读原文哦!

img

AI技术栈的四个层次

  • 应用程序 Applications:基于现有模型构建的开源应用程序,如编程、工作流自动化、信息聚合等。
  • 应用开发 Application development:在现有模型基础上开发应用程序,涉及提示工程、RAG、AI接口等。
  • 模型开发 Model development:提供开发和训练模型的工具,涉及框架、推理优化、数据集工程和评估等。
  • 基础设施 Infrastructure:包括服务工具、计算管理、向量搜索、数据库等。

img

AI技术栈的发展趋势

  • 2023年新工具爆炸性增长,特别是 Stable Diffusion 和 ChatGPT 问世之后。
  • 其中,应用程序(紫色)应用开发层(红色) 增长最为显著,基础设施层 (蓝色) 增长较小。
  • 应用程序进行分类,可以看到占比从高到底分别为:编程、机器人、信息聚合、图像生成、工作流自动化、写作

img

开源AI开发者的贡献

  • 多个账户拥有4个以上的 500 Star 仓库,上图左是其中的 TOP20,可以看到基本都是知名企业账户 (其中3个属于 Google)
  • 个人账户在应用程序层中的比例较高,在基础设施层中较少。

中国开源生态系统的崛起

  • 已经有许多AI仓库是专门面向中文用户群体的,这说明 GitHub 在中国用户中已经已经非常普遍。
  • 需要注意的是,GitHub排名前20的账户中,有6个来自于中国

快速增长后无人问津

  • 许多项目在短时间内获得了巨量的关注,但是很快又归于沉寂,作者和朋友们称其为「炒作曲线 (hype curve)」。
  • 这种现象并不罕见,大致规律是:发布初期由于新颖性或解决了某个热门问题,迅速吸引大量用户和开发者的关注;随后在社交媒体、技术论坛和新闻中传播并形成热潮,吸引更多开发者参与其中;随着时间推移,项目由于未能满足期望或停止维护等原因,热度逐渐消散。

🉑 用6个月开发代码生成工具GPT Pilot」,这是开发者的精华笔记

img

github.com/Pythagora-i…

GPT Pilot 是一款代码生成工具,与最近大火的「Devin」相似但弱一些:能够独立规划任务并启动编程,能在遇到困难时向人类寻求帮助。

不同于 Devin 的高度智能化,GPT Pilot 更像是一位需要指导的初级程序员

blog.pythagora.ai/2024/02/19/…

作者在完成 GPT Pilot 后,真的用它开发了几款应用!而这些开发工作整整花费了6个月的时间。作者将经验和心得整理成了如下的笔记:

GPT Pilot的核心理念

  • 人工智能的人类监督:为了确保开发方向的正确性,并根据实际开发结果进行调整,人工智能需要人类的监督和指导。
  • 错误修正的迭代能力:GPT Pilot能够执行代码,检查输出结果,并根据 LLM 的反馈进行必要的修正。
  • 软件开发的流程编排:借助LLM的智能决策能力,可以对开发过程中的重复任务进行有效编排。
  • 编码的非线性特性:编码过程中常常涉及到代码的重构,GPT Pilot需要能够灵活选择不同的实现路径,以适应这些变化。

实践中的深刻洞察

  • 应用初始描述的关键性:一个精确的初始描述对于GPT Pilot的整个思考和执行过程至关重要。
  • 代码重构的必要性:GPT Pilot也需要具备代码重构的能力,以应对开发过程中的各种挑战。
  • 自我审查的代理机制:通过不同的“审查者”代理对代码实现进行审查,可以有效提升开发效率。
  • 专注单一问题的LLM优势:LLM在集中精力解决单一问题时表现更为出色,因此应避免在单个提示中包含多个问题。
  • 日志记录的重要性:GPT-4创建的代码包含详细的日志记录,这对于调试工作至关重要。
  • 代码库的模块化:将代码库划分为多个小文件,有助于GPT-4更好地实现功能和修复错误。
  • 代码和思路的清晰展示:为了让人类能够有效地修正GPT Pilot编写的代码,必须清晰地展示代码内容及其背后的逻辑。
  • 利用人类的惰性:人们更倾向于回答具体问题,而不是提供开放式的反馈。
  • 激发LLM的创新思维:要让LLM跳出常规思维模式,需要给出明确的指导和具体的解决方案。

GPT Pilot 实际应用案例

  • Prompt Lab:这是一个功能强大的对话运行和分析工具,可以帮助用户深入理解和优化提示词。耗时2天。
  • SQLite数据库分析工具:一个内部工具,专门用于分析SQLite数据库,以便更好地理解和优化数据结构。耗时2天。
  • Code Whisperer:一个展示项目,用户可以通过它向LLM咨询有关代码库的问题,从而获得深入的代码分析和建议。耗时7小时。
  • Star History:一个工具,用于比较Github仓库的 Star 增长速度,并且提供可缩放的图表展示,帮助开发者了解项目的发展动态。耗时6小时。

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

img

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

  • 14
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值