赛博·新闻
1、通义千问第二代视觉语言模型宣布开源
9月2日消息,阿里云公众号发文,宣布通义千问宣布开源第二代视觉语言模型Qwen2-VL,并推出2B、7B两个尺寸及其量化版本模型。此外,旗舰模型Qwen2-VL-72B的API已上线阿里云百炼平台,用户可直接调用。相比上一代模型,Qwen2-VL性能的得到了全面提升:
- 可读懂不同分辨率和不同长宽比的图片,在DocVQA、RealWorldQA、MTVQA等基准测试创下全球领先的表现
- 能理解20分钟以上长视频,支持基于视频的问答、对话和内容创作等应用。
- 具备强大的视觉智能体能力,可自主操作手机和机器人,借助复杂推理和决策的能力,Qwen2-VL可以集成到手机、机器人等设备,根据视觉环境和文字指令进行自动操作
- 理解图像视频中的多语言文本,包括中文、英文,大多数欧洲语言,日语、韩语、阿拉伯语、越南语等
2、阶跃星辰上线图像生成大模型Step-1X
阶跃星辰公司推出的图像生成大模型Step-1X正式上线,该模型在图像生成方面表现出色,尤其擅长处理中国风内容,支持长达2000字符的图片生成指令,满足多种创作需求。模型采用DiT架构,优化了深度语义对齐和细节生成能力。此外,官方还披露了两个提升图像效果的隐藏玩法,包括使用特定咒语和智能助手跃问优化生成指令。阶跃星辰同时推出了极速版模型Step-1-flash和开放平台体验中心,旨在降低开发者门槛,推动AI应用的普及。
3、开源大模型Reflection 70B发布
开源模型领域再次出现新的黑马——Reflection 70B,底层模型基于Meta的Llama3.1 Instruct,该模型由HyperWrite CEO Matt Shumer和GlaiveAI创始人Sahil Chaudhary在三周内完成。从基准测试结果来看,该模型在MMLU、MATH、IFEval、GSM8K等基准测试中均超越了GPT-4o,并击败了405B参数的Llama3.1。通过使用Reflection-Tuning技术,该模型甚至能够在给出最终回复前检测并纠正自身推理中的错误。据悉,Reflection 70B的高性能还与Glaive提供的高质量数据有关,该公司去年获得了350万美元的种子轮融资。官方宣称,Reflection405B将于下周推出,预计将成为世界上最强大的AI模型。
4、面壁智能推出MiniCPM3.0基座模型
本周,面壁智能宣布,面壁「小钢炮」系列进化为全新MiniCPM3.0基座模型,以4B参数,带来超越GPT-3.5的性能。面壁智能表示,MiniCPM3.0仅以4B参数,在包括自然语言理解、知识、代码、数学等多项能力上对GPT-3.5实现赶超,在Qwen2-7B、Phi-3.5、GLM4-9B、LLaMa3-8B等一众模型脱颖而出。此外,MiniCPM3.0还拥有端侧最强Functioncalling性能,在权威评测榜单Berkeley Function-Calling Leaderboard上,其性能接近GPT-4o,并超越Llama3.1-8B、Qwen-2-7B、GLM-4-9B等众多模型。开源地址:
5、对标GPT-4o,腾讯推出新一代大模型混元Turbo
9月5日,腾讯宣布推出新一代大模型混元Turbo。腾讯表示,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o。目前,腾讯混元Turbo已经在腾讯云上线,输入和输出价格只有前代模型的一半。企业和开发者可以通过API、专属模型、精调模型等方式使用腾讯混元大模型相关能力。
赛博·洞见
1、从设计智能到美学潮流:MIT实验室如何引领未来设计风向?
本文介绍了计算美学的概念及其在设计领域的应用,特别强调了MIT设计智能实验室如何利用大型语言对象(LLOs)推动设计创新。文章通过三个案例——Narratron、VBox和AIncense——展示了LLOs在音乐体验、故事创作和文化互动中的应用,强调了计算美学与智能设计结合的潜力,并推荐了伦敦大学学院开设的艺术与科学专业,为对计算美学感兴趣的学生提供了教育途径。
2、2万字长文,如何成为一个“懂”AI的产品经理?
本文深入探讨了非算法团队的产品经理如何理解并有效利用AI,尤其是大模型技术。文章分析了AI产品的工程化过程,大模型的局限性,以及如何从业务角度挖掘其商业价值。同时,探讨了大模型在实际应用中的挑战,如成本、性能、上下文窗口大小,以及与现有技术的融合问题。作者还讨论了AI时代产品经理的角色转变,强调了理解AI技术、掌握API调用、进行实验和优化的重要性。文章最后提出了针对AI产品经理的实践建议,旨在帮助他们更好地利用AI技术改进产品。
3、2030年,ScalingLaw会到达极限吗?GPT-6能出来吗?
文章分析了AI训练规模增长的四个主要瓶颈:电力供应、芯片产能、数据稀缺和通信延迟。预计到2030年,AI训练的计算量可能达到2e^29FLOP,实现类似GPT-4到GPT-2的能力飞跃。尽管存在挑战,但通过技术创新和投资,突破这些限制是可能的。电力和芯片产能是当前最紧迫的瓶颈,而数据稀缺和延迟限制则相对较远但不可忽视。AI的持续增长将吸引巨额投资,推动技术进步和经济增长。
4、融资1000万美金,最近海外这款AI+视觉工具爆火,旨在将复杂想法可视化
NapkinAI是由前谷歌工程师Pramod Sharma和Jerome Scholler创立的AI工具,旨在帮助用户将文本内容转换为视觉元素,以提高信息传达的效率。该平台通过简化设计流程,使用户无需设计技能即可生成流程图、图表和信息图。NapkinAI在2024年8月获得了1000万美元的种子轮融资,并计划扩展团队和产品功能。
5、Sam Altman:在风暴中心引领AI革命——动荡与技术未来的对话
OpenAI首席执行官Sam Altman在崔娃Trevor主持的深度访谈中,分享了他对人工智能未来的看法,包括通用人工智能的潜力、AI的安全性和伦理问题,以及资本主义与AI的平衡。Sam讨论了他对OpenAI公司治理的思考,强调透明性和民主化技术治理的重要性。访谈还涉及了Sam个人在OpenAI的起伏经历,以及他对AI技术如何改善全球教育和医疗水平的乐观预期。
6、外滩大会上,我们看到了人工智能五年后的样子
外滩大会上,人工智能的未来趋势成为焦点。尽管AI在应用层面尚未实现“iPhone时刻”,但大会展示了AI的持续发展。大模型面临算力和数据质量问题,而小模型/端侧模型因其低能耗和特定任务优势,更可能在行业应用中率先落地。异构计算、数据服务商和AI Agent成为关键技术,预示着AI将逐渐融入日常生活,推动行业创新和人机交互方式的变革。
7、吴恩达,对Agentic Workflow持续兴奋
吴恩达在多个演讲和访谈中强调了Agentic Workflow的重要性,并对AI的未来应用和进步持乐观态度。他认为AI将广泛应用于各行各业,并且随着硬件的进步和成本的降低,AI的应用将更加广泛和高效。同时,吴恩达也提到了AI的自我批判能力和快速推理的重要性,以及开源对于推动AI发展的重要性。
8、最新Andrej Karpathy深度对话:从自动驾 到教育革命,探索AI重塑人类未来
AI领域的大神级人物Andrej Karpathy与NoPriors投资播客展开了一场关于人工智能现状和未来发展,及其对教育和认知影响的深度探讨。Andrej Karpathy分享了对AI现状和未来的见解,特别强调AI应赋能人类而非取代。他讨论了自动驾驶技术、AI研究进展、教育领域的AI应用、人机融合可能性及AI对学习方式的影响。Karpathy正开发AI教育平台,旨在提供个性化教育体验,并对教育的民主化和未来教育模式持乐观态度。
9、LLM进化分岔口:多模态、成本、代码推理
本文分析了2024年至今OpenAI和Anthropic在大型语言模型领域的技术进展和产品发展。OpenAI专注于模型成本降低和多模态能力提升,而Anthropic则聚焦于模型的推理能力,尤其是在代码生成方面。两家公司的技术路线和产品策略反映了创始人风格、团队技术审美和商业路线图的差异。文章还讨论了人才流动、研究进展和产品创新,揭示了LLM领域的最新趋势。
10、Anthropic是如何构建Artifacts的?
Anthropic的Artifacts功能由研究科学家Alex Tamkin的简单想法发展而来,旨在简化网站生成流程。通过内部会议和团队合作,Artifacts在3个月内从原型发展为成熟产品。技术栈包括Streamlit、Node.js、React等,同时注重安全性。AI辅助编程在开发中发挥了关键作用,团队利用Claude加速开发过程。Artifacts的成功展示了AI在降低编程门槛、加速开发流程和促进协作方面的潜力。
11、赫拉利新书《智人之上》内容速递,服务器、钢铁、电力成为AI下一轮竞争关键
尤瓦尔·赫拉利的新书《智人之上》深入探讨了AI对全球政治、经济、社会和文化的影响,强调了人类在面对AI挑战时的分裂和无力感。同时,红杉美国合伙人David Cahn在播客中提出,AI领域的竞争将转向服务器、钢铁和电力等基础设施的建设。赫拉利警告AI可能带来的威胁,而Cahn则关注于AI硬件基础设施的未来发展和对行业的深远影响。
12、YC万字分享谈“AI泡沫”:过多的融资是枷锁,你必须真正赚钱
YC投资人在万字分享中讨论了AI领域的泡沫现象,他们认为虽然存在过度炒作的担忧,但AI技术的实际应用和盈利能力证明了其价值。他们强调,尽管一些AI公司可能估值过高,但真正重要的是能否持续盈利和拥有忠实客户。YC投资人还提到,AI领域的创新和应用正在加速,小型创业公司通过专注于特定领域和解决方案,能够实现快速增长和盈利。
13、曲晓音,斯坦福辍学创业被收购,再创业AI教育获OpenAI投资,打造孩子的专属导师和玩伴Heeyo
Heeyo AI的创始人曲晓音分享了她从斯坦福辍学创业,到成功创办Run The World并被收购,再到创立AI教育公司HeeyoAI的历程。Heeyo AI旨在为3到11岁儿童提供个性化AI教育伙伴,通过游戏和探索激发孩子们的好奇心和创造力。公司已获得OpenAI等知名投资者支持,致力于成为孩子的好伙伴和父母的好助手。
赛博·工具
1、squoosh
免费漂亮的在线图片压缩网站。
2、SVGLOGO
收录国内矢量LOGO,目前包含国内社媒、大学校徽、气象预警及工具产品等。
赛博·资源
1、paper-reading
深度学习经典、新论文逐段精读,李沐大佬的项目,非常详细。
2、黑神话悟空修改器
由风灵月影大佬制作,包含42项修改。
3、下一本读什么
高质量书单指南,手动收集定期更新各种在豆瓣8分以上书单。
【推广时间】
欢迎大家关注我的个人公众号【产品老A】。
公众号简介:6年互联网大厂AIPM,专注探索新型人机交互。
老A是谁?——AI领域多年从业经验,见证了AI的沉寂和崛起。 热爱AI技术和产品,更热爱分享,希望将知识传递给更多人。 坚信AI的力量,致力于推动AI技术的应用和普及。