为什么整个 AI 领域都朝着 AI Agent 的方向发展? 吴恩达在近期演讲中大谈 AI Agent,他认为,在精心设计的 Agent 工作流程(workflow)中使用多个 Agent,可以在现有模型中产生“次时代”级别的性能。所以,基于 GPT-3.5 构建的 Agent 工作流程在应用中的表现能比 GPT-4 要好。AI 大佬们都认为 AI Agent 是发展趋势,对未来的工作方式会产生重大影响。那么它到底是什么?能给我带来什么改变呢?
使用本地大模型运行 AI 搜索 - 开源项目 LLocalSearch 像 perplexity.ai 和秘塔,都是AI搜索,根据我们的输入内容,搜索网络资料,然后读取、分析、提炼、总结,给出结果。LLocalSearch 是一个开源项目,可以在我们的本机实现 AI 搜索。
AI时代,搜索引擎的巨头地位恐怕不保了 兄弟们,你们使用搜索网站的频率有降低吗? ChatGPT 已经流行了一年多了,这期间数个大模型都发展了起来。 搜索引擎本质上也属于问答系统,所以,在大模型成熟之后,我使用搜索的频率越来越低了。
白嫖 kimi.ai 的 API 接口,给这个开源项目点赞! Kimi 开放了 API 接口,新用户注册后会免费赠送 15 元额度。如果赠送额度用完了,你还想继续免费体验,那么,下面的这个开源项目一定要试试。
训练自己的声音模型,效果超级逼真,最牛的开源声音克隆项目 GPT-SoVITS GPT-SoVITS 是一个开源的声音克隆项目,可以训练自己的声音模型。 效果非常好,使用超级简单。 如果你有声音克隆的需求,必须要试试这个项目。
超快的 AI 实时语音转文字,比 OpenAI 的 Whisper 快4倍 -- 开源项目 Faster Whisper faster-whisper 这个项目是基于 OpenAI whisper 的模型,在上面的一个重写。使用的是 CTranslate2 的这样的一个库,CTranslate2 是用于 Transformer 模型的一个快速推理引擎。在相同精度的情况下,faster-whisper 的速度比 OpenAI whisper 快 4 倍,并且使用更少的内存。这是 faster-whisper 与 OpenAI whisper 的测试对比结果,使用了一个13分钟的音频做的测试。
OpenAI 开源的免费 AI 语音转文字工具 - Whisper,一步一步本地部署运行 Whisper 是 OpenAI 研发的一个通用的语音识别模型,可以把语音转为文本。它在大量多样化的音频数据集上进行训练,同时还是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别
开源项目 - 印钞机(MoneyPrinter),全自动生成短视频 现在短视频这么火爆,流量就是金钱。如果能全自动的生成短视频,是不是很容易带来流量,赚到马内。MoneyPrinter 这个开源项目就可以自动生成短视频,而且质量还不错,不是那种低质的营销视频。
这个神器的网站,可以让我们在国内畅玩 GPT4、Claude3 Opus、 Gemini-pro 等大模型 国内直接访问,无需魔法,无需注册,打开即用,免费,GPT4、Claude3 Opus、 Gemini-pro 这些收费模型都可以免费用,模型超级丰富,收费的、免费的、开源的,几十款模型供你选择
隆重介绍一下 Devin,全球首位 AI 程序员 Devin 是世界上第一个全自动的 AI 程序员,由 Cognition 开发,即将开放使用,现在公布了等待列表。从 Cognition 的介绍中可以看到,Devin 体力好,根本不知道累,态度好,兢兢业业,996 没意见,技能好,会的多,学的快,既可以配合你工作,也可以独立工作。
本地运行 AI 音频分离开源项目 - Spleeter 把音频中的不同音频源分离出来,是影音处理领域中的常用操作。最普遍的需求就是把人声、背景音乐提取出来。Spleeter 是开源的音频分离工具,分离效果非常好。
一个 64k star 开源项目的作者公开了收益和技术栈 如果你捣腾过 ChatGPT 独立部署调用,那么就大概率接触过这个项目,作者是个敞亮儿人,发帖说已经把这个网站卖了,并且公开了这个站给他带来的收益和所用到的技术栈。
看了这3个帖子之后,我被 Claude3 惊呆了! 说实话,看到 Claude3 的测试成绩之后,我个人并没有感到多么震惊,顶多是 “不错哦” 的感觉。 但今天看到了有关 Claude3 的3篇贴子之后,瞬间不淡定了,感觉被震了。