70年,800个,全球AI大模型数据可视化;750名工程师透露的AI真相;GenAI将取代初级程序员?NO!出海美国的创始人必读手册 | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦!



1. Anthropic 发布 Claude Artifacts,大模型从「聊天」正式迈入「工作流」

上周,Anthropic 公司发布了最新的大模型 Claude 3.5 Sonnet,随后几天陆续斩获各榜单的一二名。

以权威榜单 LMSys Chatbot Arena Leaderboard 来说, Claude 3.5 Sonnet 在「Overall (全部)」榜单中排名全球第二在「Coding (编程)」榜单中位列全球第一


这次发布更应引起关注的,是官方在 Claude Chat 中增加的一项新功能「Artifact」。

简单说就是,用户要求 Claude 生成代码片段、文本文档、网站设计等内容时,屏幕右侧会自动弹出 Artifact 空间 (👆 如上图所示,需要在个人账号 → Feature Preview → 打开 Artifact 设置),可以展示代码,其中前端编程语言的代码还可以查看呈现样式


↑ 要求「Create an HTML animation to demonstrate the working principle of “A Simple Neural Network”」,即创建一个 HTML 动画演示简单的神经网络的运行原理。

Claude 对问题进行了分析 (上图左侧),并生成了 HTML 代码段并支持预览最终的动画效果 (上图右侧)

从 X 和 Youtube 等社交媒体的反馈来看,用户们相当欣喜啊!纷纷尝试生成各种小游戏,然后越来越复杂:贪吃蛇、计数器、倒计时、声音效果生成器、用 CSS 编写简历、生成网页…


国产大模型 DeepSeek 也支持类似功能哦!登录后左侧选择「代码助手」,输入任务提示词,生成 HTML 代码后点击右下角「运行HTML」,就可以在弹框里预览生成效果了!

↑ 上图是 DeepSeek 同样提示词的 HTML 运行结果。相较于 Claude Artifact,DeepSeek 目前还有很多局限:例如代码能力弱了一点 (Coding 排行榜第5),仅支持运行 HTML 代码,不支持上传图片和文件 (这点影响很大)…… 综合起来就有了明显的体验差异。


除了超越的编程能力 & 动态预览交互带来的眼前一亮,Claude Artifact 最重要的是把大模型集成进了更多用户的工作流,摆脱了「聊天助手」的尴尬定位。

这类功能目前支持的编程语言、协作方式还很有限。非常期待这个功能的进一步拓展,支持运行更多编程语言 (例如 Python 👀),或者成为团队协作工作流的重要组件 (甚至平台)。



2. 全球AI模型 ● 数据可视化:60年踽踽前行,近10年突飞猛进

Epoch AI 在其网站更新了全球 800+ AI模型的详细信息 (数据截至本月19号),并制作了一个可交互的数据图。

AI 模型的起源要追溯到遥远的1951年。然后,一代代科学家和工程师的不断努力,将AI带入深度学习时代,并最终于2022年末爆发出巨大的能量,引发了新一轮的科技革命

🔔 Notable AI Models

这张可交互的数据图表名为「Notable AI Models」,即知名AI模型 (页面下方有入选标准)。X轴和Y轴的含义可以在下方参数中进行选择:

  • 训练计算量(FLOP)
  • 可训练参数数量
  • 训练数据集大小(datapoints)
  • 训练计算成本(2023 USD)
  • 发布日期

根据这份数据和可视化图,我们可以得到以下 4 个结论:

  • 知名AI模型的训练计算量,大约每6个月翻一番。
  • 最大的AI模型的训练计算成本,大约每9个月翻一番。
  • 与视觉模型相比,语言模型的训练计算量增长更快。
  • 用于训练语言模型的数据集大小,大约每8个月翻一番。

🔔 Large-Scale AI Models

这是 Epoch AI 网站同期公布的另一份可交互数据图「Large-Scale AI Models」,即大规模AI模型,共有 180 多个模型入选。入选标准也很明确,FLOP>10^23,这个参考数据大致相当于 GPT-3 大模型的计算规模。既然是动态可交互的数据图,那么X轴和Y轴的含义也可以选择:

  • 训练计算量(FLOP)
  • 可训练参数数量
  • 训练数据集大小(datapoints)
  • 发布日期

从这份数据中,我们可以观察到以下规律:

  • 大规模模型发布的速度在加快。
  • 语言模型构成了大部分的AI大模型。
  • 大多数的大模型是由美国公司开发的。
  • 几乎一半的大模型有公开发布的、可下载的权重。

值得注意的是,将鼠标放在网站图中的圆点上方,可以看到该模型的主要信息!👆 如上图左侧所示。

而且!网站支持下载数据文件:点击页面「Download this data」按钮,就可以下载 .csv 格式的数据文档~

Notable AI Modelshttps://epochai.org/data/notable-ai-models

Large-Scale AI Modelshttps://epochai.org/data/large-scale-ai-models



3. 是时候知道「AI真相」了:750名AI工程师,深度参与的2024调研报告

Retool 去年就发布了一份「技术从业者」为主的 AI 调研。前几天,今年的 AI 技术调研问卷的结果&解读都正式发布了。报告回应了很多棘手&尖锐的话题,并且给出了比较客观的统计和分析

以下是报告提到的话题,看看有你感兴趣的嘛:

  1. AI采用率激增是真的吗?
  2. 领导层呼吁AI投资多多益善!
  3. 产品经理与工程师已经成为AI深度用户
  4. AI真的能显著提升生产力!
  5. 光明正大 VS 偷偷摸摸
  6. 编程基础岗位受到最大威胁!但没有基层何来中高层?
  7. 最活跃最真实的AI应用场景
  8. 你想得到、想不到的领域,都在用AI
  9. 2B or 2C
  10. AI应用程序即将爆发
  11. OpenAI占据市场大半壁江山
  12. 模型定制化技术深受欢迎
  13. 大量公司在构建自己的模型
  14. 向量数据库的兴起
  15. 推理平台尚未普及
  16. 开发者工具的重要性
  17. 公司如何分配GPU资源?
  18. 对AI技术栈的综合评价

我们选择3个有意思的话题,对图文进行整理和解读:

与半年前相比,使用AI可以提升工作效率成为越来越多公司的共识。但是!仍然有超过 1/4 的人在偷偷摸摸使用AI??

仔细看看,这部分人中只有 8.8% 的人直接违反了公司政策。其他更多是在纠结对AI的看发,或者缺乏明确的政策支持使用AI。


这是今年统计的最高频的AI应用场景。尤其值得注意的是,与去年相比,变化趋势似乎也在告诉我们一些故事

  • 编程或查询从 47.5% 下降到 42.1%,文案写作也从 32.9% 下降到了 28%
  • 聊天机器人从 28.9% 上升到 33.9%,自动化工作流从 12.9% 跃升至 17.8%

各种大模型的市场采用占比 (仅就这次调研)。

原文https://retool.com/blog/state-of-ai-h1-2024



4. GenAI将取代初级程序员?NO!这个想法荒诞且危险!

这篇文章最近在外网很火,原文标题「Generative AI Is Not Going To Build Your Engineering Team For You」,直翻就是GenAI不会为你构建工程团队

文章的核心思想是说,一个完整的、运转良好的工程团队,依旧是以人为核心的GenAI可能在某些环节提供帮助,但「替代初级工程师」这个观点既不可行,也不可取


文章作者 Charity 是 honeycomb.io 的联合创始人兼首席技术官 ,还曾经在 Parse、Facebook、Linden Lab 等公司担任运营工程师和工程经理。

她回顾自己十几年的技术从业生涯,有感于当下 GenAI 对行业的冲击和挑战,写下了当下的思考:

  1. 软件行业正在成熟:软件行业早期门槛低、不规范,但已经慢慢发展成为了一个标准更高、专业化更强的领域,因此提升了入行门槛。Charity 也在庆幸自己入行早……

  2. 软件行业本质上是师徒制行业:软件行业重视实践学习和经验积累,项目中的实际操作、编码、审查、部署代码以及与资深工程师的合作,才是学习和成长的主要途径。

  3. "高级工程师"的真正含义:成为高级工程师不仅意味着编写代码的能力,更包括对大型软件系统的深入理解、维护、解释和管理,以及将业务需求转化为技术解决方案的能力。

  4. 必须停止损害自己的未来:有观点认为AI可能取代初级工程师。但行业必须认识到初级工程师的重要性,并加大对他们的招聘和培养,毕竟未来不可能把代码的运维、理解和扩展这些繁重的工作交给AI。

  5. 编程其实不是最难的部分:编程本身是软件工程中相对简单的部分。真正的挑战在于代码的运维、理解、扩展和整个生命周期的管理。GenAI 工具虽然使编写代码变得更容易,但并不能帮助更好地管理、理解或操作代码,有时甚至增加了难度。

  6. 生成代码容易,生成优秀代码难:尽管AI使代码生成变得容易,但生成符合实际需求和编码标准的优质代码仍是挑战。AI生成的代码看似合理,但常需人工审查和调整,以确保其可靠性和一致性,这在实际开发中可能并不节省时间。

  7. 工程师实际上如何使用GenAI:GenAI在生成示例代码、编写繁琐代码片段或在不熟悉的语言中生成小功能时非常有用.但使用时必须谨慎,需手动验证AI生成的代码。

  8. GenAI有点像初级工程师:GenAI在快速生成代码方面像初级工程师,当然我们需要像对待新手代码一样仔细理解和测试这些生成的代码。

  9. 但GenAI并非你团队的一员:尽管GenAI能快速生成代码,但它不能取代团队成员的角色,缺乏人类互动、学习和文化适应能力,也没有促进成长的反馈机制,不会对团队氛围产生积极影响。

  10. 我们往往低估了聘请高级别人才的成本,高估了聘请初级别人才的成本:初级工程师在执行任务和成长方面有巨大潜力,而且招聘任何级别的工程师都需要时间来适应团队环境。

  11. 并非只有高级工程师才能为团队增值:中级工程师由于能够专注于编写代码,没有被会议和其他管理职责所拖累,往往在开发和发布功能方面表现出极高的效率和创造力,对团队贡献巨大。

  12. 招聘初级工程师的长远考量:团队需要培养更多高级工程师、降低成本、增加团队多样性、提高员工忠诚度等。这些道理大家都知道,但是公司通畅因为一些短期利益而选择忽视。

  13. 招聘初级工程师的短期优势:初级工程师能为团队带来新的视角和活力。

  14. 一个健康、高效的团队应包含不同级别的成员:健康且高效的团队应包含不同技能水平和经验的成员,这样的多样性确保团队能应对各种挑战。

  15. 我们面临的难题在于招聘,而非培训:软件行业的主要障碍是为初级工程师提供首份工作的机会,公司应将初级工程师视为投资而非成本。

  16. 是否每家公司都需要招聘初级工程师:当然不是。

  17. 没人会自动来解决我们的问题:改变初级工程师招聘和培养的现状,需要工程师和工程经理的主动参与,而不是被动等待外部的介。

原文https://stackoverflow.blog/2024/06/10/generative-ai-is-not-going-to-build-your-engineering-team-for-you/



5. 写给美国创企 Founders 的执行手册:两位资深律师带你穿越法律迷雾

这是一份由资深律师执笔的创业指导手册,面向美国本土科技初创公司的创始人,告诉他们在创业初期应该做哪些事情,以及有哪些注意事项。更重要的是,作者们列出了常见的「误区」,并进行了一一解释。

如果你正在计划「出海」,设立一家美国公司并将产品推出到海外,或者也有招聘和融资等相关计划,不妨看看这篇手册,对目的地有个大致的了解。

文章提到的「Startup Incorporation」可以粗浅地理解为公司注册,即将自己的业务变成一个法律实体,需要向州提交文件。

以下是手册详细解释过的话题,感兴趣可以前往阅读原文:

初创公司为何要进行公司注册?

  • 有限责任
  • 股权分配能力
  • 简化招聘流程
  • 降低联合创始人风险
  • 便于筹资

有限责任公司(LLC)又如何?

  • 税务考量
  • 灵活性与定制性
  • 运营的便捷与成本
  • 股权补偿
  • 转换可能性
  • 投资者偏好

我应在何时成立初创公司?

  • 多位创始人的情况
  • 筹资需求
  • 招聘活动
  • 拥有客户
  • 签订合同
  • 不寻常的责任风险
  • 公司名称的可用性
  • 现有雇佣状况
  • 资本收益

我应在何地成立初创公司?

  • 初创公司的法律生态
  • 投资者的偏好
  • 文件提交的便利度
  • 特许经营税
  • 注册代理费用
  • 董事会的灵活性
  • 匿名性与隐私保护
  • 责任保护
  • 加密货币/区块链考量

公司章程是什么?

  • 制定公司章程
  • 提交公司章程
  • 盖章副本与认证副本的区别
  • 提交后的操作

初创公司章程中通常包含哪些内容?

  • 公司名称
  • 创立人
  • 生效日期
  • 注册代理
  • 公司类型
  • 股票种类
  • 授权股份总数
  • 面值

原文https://handbooks.clerky.com/startup-incorporation

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ > 前往 🎡ShowMeAI,获取结构化成长路径和全套资料库,用知识加速每一次技术进步!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ShowMeAI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值