20240630 每日AI必读资讯

最新推荐文章于 2024-09-17 16:52:57 发布

程序员的店小二

最新推荐文章于 2024-09-17 16:52:57 发布

阅读量1.6k

点赞数 7

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46163918/article/details/140072926

版权

📚全美TOP 5机器学习博士发帖吐槽：实验室H100数量为0！

- 普林斯顿、哈佛「GPU豪门」，手上的H100至少三四百块，然而绝大多数ML博士一块H100都用不上

- 年轻的研究者们纷纷自曝自己所在学校或公司的GPU情况：1张2080Ti+1张3090，已是全部

🔗 全美TOP 5机器学习博士：痛心，实验室H100数量为0！-CSDN博客

💻GPTPDF：是一个使用GPT-4o将 PDF 解析为 Markdown 的工具

- 仅293行代码，它可以几乎完美地解析任何 PDF 文件，包括排版、数学公式、表格、图片和图表等内容，平均每页成本为 $0.013。

- 工作原理：

使用 PyMuPDF 库，首先对 PDF 进行解析出所有非文本区域，并做好标记

然后使用 GPT-4o进行解析，得到 markdown 文件。

🔗GitHub：https://github.com/CosmosShadow/gptpdf

- 案例展示

🔗原始PDF：
https://github.com/CosmosShadow/gptpdf/blob/main/examples/attention_is_all_you_need/output.md

🔗解析后的PDF：
https://github.com/CosmosShadow/gptpdf/blob/main/examples/attention_is_all_you_need/output.md

🌐Character AI推出新功能让你可以与AI角色进行通电话

- 支持多种语言，包括英语、西班牙语、葡萄牙语、俄语、韩语、日语和中文。

- 可以选择不同的声音、音调、口音和个性，定制化自己的AI角色声音。

- 可以在通话和短信之间无缝切换，通过“点击打断”选项随时停止AI讲话。

🔗访问尝试：https://character.ai

🔗 https://blink.csdn.net/details/1745092

🤖微软文本转语音虚拟数字人上线支持GPT-4o的集成

- 可以创建实时互动的数字人，但是目前语音使用的还是微软自己的

- 可以接入大语言模型直接和自己的服务集成

- 提供实时互动的数字人服务，比如在线客服、导游、讲解员等。

1.自然声音视频：将文本转换为自然声音说话的数字人视频。

2. 预生成虚拟形象：提供预生成虚拟形象的集合，用户可选择使用。

3.多种语言支持：支持与文本转语音相同的多种语言和声音，包括英语、中文、西班牙语等。

4. 批量和实时合成：支持1920×1080分辦率、每秒25帧的视频合成，批量合成支持h264/h265/vp9编解码器，实时合成支持h264编解码器。

5.自定义虚拟形象：用户可以创建自定义的文本转语音虚拟形象，只需录制10分钟的视频，并可选择自定义神经网络声音。

6.实时互动：在Speech Studio中提供的实时聊天虚拟形象工具，可以实现实时虚拟形象对话。

7.高质量视频输出：支持高清分辨率和多种编解码器，用户可以配置视频比特率以满足不同需求。

8.无代码创建工具：Speech Studio提供内容创建工具，无需编码即可创建视频内容。

🔗 https://blink.csdn.net/details/1745088

程序员的店小二

关注

7
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。