1 Al与人类之间无休止斗争的又一个战场:验证码
新智元 |阅读原文
验证码作为区分人机的重要手段,正面临人工智能技术的挑战。Al 通过深度学习和神经网络技术,已能绕过多数验证码。同时,验证码技术也在不断进化,如 reCAPTCHA 通过分析用户行为来识别人类。未来验证码可能更侧重行为分析和生物识别,但隐私问题随之而来。Al在加强安全方面也扮演关键角色,预示着验证码与 Al的共生关系将进一步发展。
2 咳一咳就知道有没有病?谷歌开放 HeAR Al 模型 AP1,1亿条咳嗷声训练
医健网丨阅读原文
Google 研究人员开发了 Health Acoustic Representations (HeAR)模型,利用 Al 技术从声音中提取健康信息。HeAR 通过分析咳嗷等声音模式,助力早期疾病诊断。Google Research 团队使用 3亿条音频数据训练模型,特别针对1亿条咳嗷声音,HeAR 在医学音频分析中表现优异,尤其在跨麦克风泛化能力上。该技术开放给研究人员,支持定制生物声学模型,即使在数据稀缺情况下也能高效运作。印度的 Salcit Technologies 正利用 HeAR 加强其 Al模型,以提高结核病早期检测能力。HeAR 得到国际组织支持,有望成为低成本、可及的健康监测工具。
3 AI设计自己,代码造物主已来!UBC 华人一作首提 ADAS,数学能力暴涨 25.9%
新智元丨阅读原文
不列颠哥伦比亚大学的研究团队开发了智能体自动化设计 (ADAS) 系统,该系统通过元智能体搜索算法,自动设计并优化智能体,实现自我进化。在数学、阅读和推理等多个领域,新智能体展现出超越当前最佳设计的优越性能,尤其在数学领域淮确率提升了 25.9%。研究还证明了这些智能体在跨领域转移时的泛化和可转移性,为自动设计越来越强大的智能体系统开辟了新方向,预示着通用人工智能 (AGI) 的进一步发展。
4 4个人烧掉数百万 GPU,打造翻版 「Sora]
硅兔君|阅读原文
美国 Al创业公司Hotshot 仅用四人团队,耗资数百万 GPU,成功研发出视频模型 Hotshot。该模型基于
Transformer 扩散技术,能在快速对齐、一致性和运动方面提供高质量输出,支持生成更长、更高分辨率的视频。Hotshot 的测试版已开放试用,用户每天可免费生成两次无水印视频。公司成立 13 个月内连续推出三款 Al视频模型,创始人 Sastry 预测 AI 生成内容将在数字媒体中占据主流地位。
对此,你怎么看?
支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。