快讯 | 阿里开源Qwen2-VL视觉大模型:刷新多模态AI性能

图片

硅纪元快讯栏目,每日追踪AI领域的最新动态,快速汇总最新科技新闻,助您时刻紧跟行业趋势。简明扼要的呈现资讯概要,让您快速了解前沿资讯。

1分钟速览新闻

  • 阿里开源Qwen2-VL视觉大模型:刷新多模态AI性能

  • AI搜索工具Perplexity内测支付系统

  • 谷歌Gemini AI升级:文件类型解析能力大幅提升

  • 腾讯文库上线,数亿文档资源助力内容创作

  • 美国警方采用AI工具Draft One,8秒生成犯罪报告

  • Perplexity AI 推出 PPLX 支付系统,简化网购流程只需两步

  • 港大百度联合发布OpenCity模型:零样本交通预测新突破

  • 谷歌Gemini AI技能升级:支持更多文件格式,提升文档分析能力

全球AI新闻

一、阿里开源Qwen2-VL视觉大模型:刷新多模态AI性能

图片

阿里通义千问团队开源新一代视觉语言模型Qwen2-VL,其72B版本在多个视觉理解基准测试中刷新最佳表现,性能超越GPT-4o。该模型支持不同分辨率和长宽比的图片理解,能处理20分钟以上长视频,支持多语言文本理解,并可集成到手机、机器人等设备。开源模型Qwen2-VL-2B和Qwen2-VL-7B已发布,集成到Hugging Face Transformers等框架,推动多模态AI应用发展。

二、AI搜索工具Perplexity内测支付系统

图片

AI搜索网站Perplexity近日测试内部支付系统PPLX,用户可在Discover信息流中查看产品卡片并一键购买,无需跳转。Perplexity不自研大模型,而是采用GPT-3.5等进行微调,旨在打造无广告的AI搜索工具。著名企业家黄仁勋公开表示每天使用Perplexity,提升了其技术实力的认可度。

三、谷歌Gemini AI升级:文件类型解析能力大幅提升

图片

谷歌宣布其Gemini AI平台新增功能,支持更多文件类型解析。更新后,Google Workspace用户可上传多种格式文件,包括电子表格、演示文稿、图像、音频和视频,以进行数据分析、内容提取和要点总结。Gemini AI还能根据用户提示进行针对性分析,增强理解与写作能力。

四、腾讯文库上线,数亿文档资源助力内容创作

图片

腾讯文库近日正式上线,提供数亿专业文档资源,覆盖考试真题、法律合同和求职简历等。用户可快速检索所需资料,享受便捷的编辑体验。平台还整合了AI智能助手,支持深度创作、一键总结和思维导图生成,提升内容管理效率。此外,参与AMD商用电脑调查问卷,有机会获得AMD定制背包奖品。

五、美国警方采用AI工具Draft One,8秒生成犯罪报告

图片

美国警察开始运用AI工具Draft One辅助文书工作,能快速生成犯罪报告,提高报告准确性。Draft One由GPT-4支持,转录执法记录仪音频并自动生成报告。科罗拉多州柯林斯堡警察局测试显示,使用该工具后,撰写报告时间减少82%。尽管AI工具受到欢迎,但也有担忧其准确性、偏见和法律责任等问题。Axon公司表示,Draft One基于GPT-4 Turbo模型配置,进行了偏见测试,结果显示不同种族间无显著差异。目前,AI工具主要被用于轻罪报告,但一些警察局也开始尝试用于更重大案件。

六、Perplexity AI 推出 PPLX 支付系统,简化网购流程只需两步

图片

科技媒体testingcatalog报道,AI搜索网站Perplexity正在测试内部支付系统PPLX,旨在通过简化的购物流程增加用户购买率。该系统在Discover信息流中展示产品卡片,用户可以轻松查看产品评论和提示,选择数量并通过点击两下完成购买。Perplexity通过引导购买赚取佣金,首次使用时需填写支付信息,之后购物无需离开页面即可快速完成。Perplexity成立于2022年8月,专注于打造无广告的搜索体验,并获得OpenAI、Meta等支持。

七、港大百度联合发布OpenCity模型:零样本交通预测新突破

图片

香港大学与百度合作开发的OpenCity模型在零样本交通预测领域取得了显著成果。该模型融合了Transformer架构和图神经网络,有效模拟交通数据的时空依赖关系。在大规模异质性数据集上预训练后,OpenCity展现出卓越的零样本预测能力,快速适应不同交通环境,同时具备良好的可扩展性。测试结果显示,OpenCity在多个交通数据集上的性能超越了传统全样本模型,为城市交通管理和规划提供了新的技术支撑。

八、谷歌Gemini AI技能升级:支持更多文件格式,提升文档分析能力

图片

谷歌宣布对旗下Gemini AI进行技能升级,新增支持多种文件格式,包括电子表格、演示文稿、图像、音频和视频,以提供更全面的AI服务。此次升级旨在通过分析和摘录文档内容,提高用户对上传文件的理解、研究和写作能力。Gemini AI能够根据用户输入的提示词进行有针对性的分析,总结复杂主题、识别趋势,并提出改进写作和文档组织的建议。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值