Cyber Weekly #17

赛博·新闻

1、Meta 发布全球最强大模型

本周三(7.24)凌晨,Meta 发布了 Llama 3.1 模型。此次发布的 Llama 3.1 共有 8B、70B 和 405B 三个尺寸版本,模型下载地址:https://huggingface.co/meta-llamahttps://llama.meta.com/。作为 Meta 迄今为止最强大的模型,它有着如下特点:

  • 包含 8B、70B 和 405B 三个尺寸,最大上下文提升到了128K,支持多语言,代码生成性能优秀,具有复杂的推理能力
  • 从基准测试结果来看,Llama 3.1 超过了 GPT-4 0125,与 GPT-4o、Claude 3.5 互有胜负
  • 提供开放/免费的模型权重和代码,许可证允许用户进行微调,将模型蒸馏到其他形式,并支持在任何地方部署
  • 提供 Llama Stack API,便于集成使用,支持协调多个组件,包括调用外部工具

2、OpenAI推出AI搜索SearchGPT

本周五(7月26日)凌晨,OpenAI 正式宣布搜索产品 SearchGPT 开放内测,SearchGPT 利用 AI 技术提供快速、准确的网络信息检索服务,并以对话形式与用户交互。产品目前仅向部分用户开放,以收集反馈并计划将最佳功能整合到 ChatGPT 中。SearchGPT 支持文字、图片和视频搜索结果,并与新闻媒体合作,提供信源引用和链接。SearchGPT有以下特点:

  1. 生成速度很快;
  2. 信息结构化更好;
  3. 嵌入了多样式的内容维度(数据、列表、图片视频、卡片、天气等);
  4. 对于追问可以给出指向非常清晰的答案。

3、Mistral 推出 Mistral Large 2,对标Llama 3.1 405B

本周「欧洲版 OpenAI」Mistral AI 发布了 开源 AI 大模型 Mistral Large 2,直接对标Llama 3.1 405B,Mistral Large 2 拥有 1230 亿个参数,支持 128K 上下文,在代码生成、数学推理、多语言支持和高级函数调用等方面表现出色。Mistral Large 2 在多项基准测试中的表现与 GPT-4、Llama 3.1 和 Claude 3.5 Sonnet 等先进模型相当。在代码生成和数学推理方面,该模型的性能甚至超过了 Llama 3.1 405B 的模型。

4、Udio 发布新版本 v1.5,正面硬刚Suno

本周Udio发布v1.5版本,增强了音乐生成能力,包括多语言支持、音质提升至48kHz立体声、调性控制等,使其成为Suno的主要竞争对手。尽管Udio在音乐生成方面表现出色,但仍未达到取代真人的程度,特别是在音程关系和人声表现方面。Udio的更新旨在为用户提供更丰富的音乐体验,并鼓励音乐创作回归表达本质。传送地址,免费账户注册即获得体验积分,每天 10 分,每月首日加赠 100 积分,免费套餐即包含 remix 和扩展功能。

5、智谱上线清影大模型,30 秒即可将任意文字生成视频

本周智谱AI推出「清影」视频生成大模型,支持文本和图片生成视频,具有多种风格,如卡通、真实摄影和二次元动漫等。该模型清晰度高,时长6秒,免费且不限量,可通过PC和移动端访问,未来将应用于短视频制作、广告生成和电影剪辑等领域。

  • PC 端访问链接:https://chatglm.cn/
  • 移动端访问链接:https://chatglm.cn/download?fr=web_home

6、百川智能完成 50 亿元 A 轮融资,估值已达到 200 亿元

获悉,国内头部大模型 AI 初创公司百川智能于近期完成了 A 轮融资,总融资金额达 50 亿元人民币,并且将以 200 亿估值开启 B 轮融资。据官方介绍,A 轮投资方既有阿里、小米、腾讯、亚投资本、中金等头部大厂和市场化投资机构,也包括北京市人工智能产业投资基金、上海人工智能产业投资基金、深创投等国资背景产业投资基金。公司采用“超级模型+超级应用”战略,已发布12款大模型,并于5月推出AI助手“百小应”。百川智能特别看好医疗领域,认为其是大模型应用的最佳场景,并在AI医疗技术和应用上取得显著进展。

赛博·洞见

1、为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下

本文讨论了AI大模型在处理某些简单问题时出现的低级错误,如数不清单词"Strawberry"中"r"的数量。文章分析了Tokenization(分词)导致的问题,并指出Karpathy通过表情包解释了大模型的视角。同时,探讨了大模型缺乏自我认知和如何改进模型以解决这些问题。

2、万字采访 | Perplexity CEO:我们最大的障碍不是 Google,而是人们天生不擅长提问(上)

Perplexity AI的CEO Aravind Srinivas与播客主持人Lex Fridman探讨了人工智能的未来发展,特别是Perplexity作为知识发现引擎的创新之处。Aravind解释了Perplexity如何结合搜索引擎和大型语言模型提供准确且有来源支持的答案,并讨论了其与传统搜索引擎的不同之处。他还分享了关于创业、AI发展以及AI技术促进人类知识增长的见解,强调了Perplexity的使命是引导用户发现新知识,而不仅仅是提供答案

3、为什么我们相信英伟达能到 5 万亿

本文是拾象团队对过去半年AI投资的思考总结,分析了AI/LLM前沿趋势和二级市场AI板块投资主线。文章认为AI正成为科技股增长的驱动力,尤其是英伟达等公司将显著受益。作者通过多个投资逻辑强调AI领域的潜力,预测英伟达市值将达到5万亿美元,并提出AI投资的5条主线,包括算力、云基础设施、端侧、互联与软件,同时推荐了相关领域的顶尖公司。

4、对话AI语音革命者Cartesia:大模型to C应用效率为王,高效与交互性产品才能打动市场

本文对话了初创公司Cartesia的联合创始人Karan和Albert,他们介绍了公司推出的高效文字转语音引擎Sonic,并讨论了状态空间模型(SSM)在数据处理中的新机遇。文章强调了大模型to C应用中效率和交互性的重要性,以及Cartesia在开发革命性模型方面的努力和未来计划。

5、Voice Agent:AI 时代的交互界面,下一代 SaaS 入口

本文探讨了Voice Agent作为下一代人机交互界面的潜力与发展趋势。Voice Agent利用AI技术实现与人类的自然对话,与传统文本交互相比,具有低能耗、直观性等优势。文章分析了不同场景下Voice Agent的应用潜力,包括疗愈、教育、企业工作流等,并讨论了其在开发者工具、企业用户和消费者端的市场机会。

6、RAG在企业应用中落地的难点与创新(文字稿) 

本文分享了在企业应用中落地RAG时遇到的难点与创新,包括文件解析、结构化数据融合、检索能力提升和rerank模型的多种应用方式。同时,介绍了三个企业应用案例:金融研报、零售业务和规则预审,并总结了企业落地AI应用的三个关键特点:功能小、质量高、价值大。

7、分析完 400 家美国 AI 公司,我们学到了什么? 

文章分析了YC支持的417家AI初创企业,揭示了AI创新的热点行业、技术趋势、创始人背景及成功因素。B2B企业占主导,医疗保健和金融科技是主要领域。生成式AI、机器学习和自然语言处理是常见技术。创始人多具有技术背景,教育和工作经验多样。文章还讨论了AI在伦理、透明度和新兴技术中的应用。

8、专访 Luma AI 首席科学家:我们更相信多模态的 Scaling Law

Luma AI首席科学家Jiaming Song在专访中深入讨论了公司的视频生成模型Dream Machine,强调其动作幅度大和对物理世界理解的自然涌现。他提到视频是实现3D和4D生成的更好途径,并相信多模态模型的scaling law将推动模型更好地理解世界。Luma团队在产品和市场敏捷度上不断提升,同时注重模型能力与产品需求的结合。Song还探讨了多模态数据的潜力、视频生成模型的未来以及Luma AI的定位和商业策略。

9、上半年拿到投资的 15 家 AI 搜索公司,他们都在做什么?

2024年上半年,15家AI搜索公司共获得12.1亿美元投资,这些公司专注于不同的搜索领域,包括音视频搜索、电商搜索、通用搜索、向量搜索以及企业/行业场景搜索。这些公司利用先进的AI技术,提供个性化、高效的搜索服务,满足特定场景下用户的需求,同时展现出资本市场对AI搜索领域的持续兴趣和信心。

10、深度|扎克伯格最新对谈:Llama 3.1 比 GPT4 成本低 50%!未来企业拥有 AI Agent 数量或超地球总人口

Meta CEO马克·扎克伯格在对谈中展望了开源AI的未来,强调其在提升全球生产力和创造力中的重要性。他提到Meta发布的Llama-3.1开源模型,认为其在成本和性能上具有优势,有望成为行业标准。扎克伯格认为,开源AI将促进全球创新和经济发展,未来企业拥有的AI Agent数量可能超过地球总人口

赛博·工具

1、问问小宇宙

即刻推出垂直AI播客搜索引擎“问问小宇宙”,但是UI界面太复古了点,希望后面优化一下。

2、Brev.ai: 免费的AI音乐生成器在线

免费在线的 AI 音乐生成器,不需要注册。

3、AIEmoji:自然语言搜索Emoji

Emoji 搜索引擎,输入自然语言,返回最匹配的 Emoji 符号。

4、WATERMARK:图片加水印

给图片添加莱卡等 LOGO 卡片水印。

赛博·资源

1、计算机教育中缺失的一课

计算机教育中缺失的一课,翻译自麻省理工的《The Missing Semester of Your CS Education》。在传统的计算机科学课程中,从操作系统、编程语言到机器学习,这些高大上课程和主题已经非常多了。 然而有一个至关重要的主题却很少被专门讲授,而是留给学生们自己去探索。 这部分内容就是:精通工具。

2、书葵网_海量图书检索下载

读者可以在此查询本馆的图书、期刊、古籍等信息。检索条件会自动匹配书名、作者、出版社、ISBN搜索,返回最优匹配结果:

3、AI加速品牌智慧出海报告(关注公众号【产品老A】回复【AI加速品牌智慧出海报告】下载)

本报告由亿邦智库联合亚马逊云科技出品,报告从品牌全球化的角度出发,分析了跨境电商在AI技术推动下的发展新阶段,包括品牌化、本土化、社交营销、科技创新等方面。报告指出了品牌独立站建设的三大痛点,如新品开发缺乏数据支撑、内容创作成本高、缺乏敏捷技术解决方案,并强调了AI作为新质生产力在解决这些问题中的关键作用。报告还详细介绍了亚马逊云科技在独立站建设、产品开发、智能广告投放、客户服务等方面的解决方案,以及成功案例,展示了AI技术在品牌智慧出海过程中的实际应用和效果。

4、AI音乐应用产业报告(关注公众号【产品老A】回复【AI音乐应用产业报告】下载)

本报告由量子位智库撰写,AI音乐生成技术通过学习音乐数据掌握音乐规律,创作音乐片段或完整音乐。技术路线分为符号模型和音频模型,后者因更自然流畅而受欢迎。AI技术简化了音乐制作流程,促进了音乐产业的变革。流媒体平台可能成为商业化的最大受益者,而传统音乐工程受冲击。数据和技术迭代对商业化至关重要,情感表达的精准控制是产品成功的关键。报告还探讨了AI音乐在不同领域的应用,如影视、游戏等,并讨论了商业模式和市场潜力。


 

5、中国具身智能创投报告(关注公众号【产品老A】回复【中国具身智能创投报告】下载)

本报告由量子位智库撰写,深入探讨了具身智能的发展历程、技术基础、国内创业生态以及行业融资情况。报告指出,具身智能作为AI领域的一个重要分支,正受到科技巨头和学术界的广泛关注。通过分析国内外具身智能创业公司的融资情况、产品开发进展以及创业者背景,报告揭示了这一领域的快速发展和未来潜力。同时,报告还讨论了具身智能技术在实际应用中的挑战和机遇,并展望了行业的未来发展。

【推广时间】

欢迎大家关注我的个人公众号【产品老A】。

公众号简介:6年互联网大厂AIPM,专注探索新型人机交互。

老A是谁?——AI领域多年从业经验,见证了AI的沉寂和崛起。 热爱AI技术和产品,更热爱分享,希望将知识传递给更多人。 坚信AI的力量,致力于推动AI技术的应用和普及。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

老A的AI实验室

给博主点一杯卡布奇诺

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值