20240130 每日AI必读资讯

👁️VisualWebArena - 自主智能体的视觉网络任务基准测试:​
- 评估智能体在网络环境中的规划、推理和执行任务能力。​
- 着重于视觉信息的重要性和多模态智能体评估。​
- 提供深入的定量和定性分析,揭示LLM智能体的限制。​
🔗 https://arxiv.org/abs/2401.13649​
🔗 https://jykoh.com/vwa​
🔗https://blink.csdn.net/details/1638135

📘LLMs-from-scratch 项目:​
- 详细解释LLMs的工作原理。​
- 提供创建自己的LLM的逐步指南。​
- 适合企业团队、初创公司和教育机构学习。​
🔗 https://github.com/rasbt/LLMs-from-scratch​
🔗https://blink.csdn.net/details/1638133

📱 Apple Vision Pro 最新宣传片:​
🔗https://blink.csdn.net/details/1638134

💡SliceGPT - 微软开发的大语言模型压缩方法:​
- 在保持高性能的同时大幅减少模型参数。​
- 允许在更少的GPU上运行,提高运行速度。​
- 显著降低了在消费级GPU上的总计算量。​
🔗 https://arxiv.org/abs/2401.15024​
🔗https://blink.csdn.net/details/1638027

⚙️“StreamVoice”成功实现实时转换,仅需124毫秒延迟!
- 该模型通过采用完全因果关联的上下文感知LM和临时独立的声学预测器,实现了流媒体能力。
- 为了解决不完整上下文可能导致的性能降级问题,StreamVoice采用了教师引导的上下文预测和语义屏蔽策略。
- LM-based的流媒体零射击VC模型,没有任何未来先行查看。
🔗 https://arxiv.org/abs/2401.11053

图片

3DHM框架:一图片可模仿任意视频动作360度无死角
- 3DHM框架可让一张图片模仿任意视频动作。
- 无需标注数据,能合成3D人体运动模仿视频中actor的动作。
- 生成长时间运动和各种高难度的姿势上更有弹性。
🔗 https://arxiv.org/abs/2401.10889

图片

🔄Arc Search:一键搜索,网页秒建,AI浏览器新体验!
- Arc Search支持一键搜索,即时构建网页。
- 融合浏览器、搜索、AI,开创全新上网方式。
- Arc Search的核心引擎是「Browse for me」引擎。

图片

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值