
AI实战
文章平均质量分 92
记录AI学习和实战过程中的一些踩坑经验和思路梳理
AI码上来
AI全栈工程师,一个每时每刻都想和你分享干货的AI狂热分子。欢迎围观公众号:猴哥的AI知识库
展开
-
SparkTTS 音色克隆 + vLLM INT8量化加速推理
本文分享了`小智AI服务端 本地TTS`的实现,对 `SparkTTS` 采用 vLLM 进行推理加速,并实践了 INT8 量化,最后对首包延时进行了实测。原创 2025-05-20 11:38:18 · 450 阅读 · 0 评论 -
低延迟小智AI服务端搭建-本地TTS篇:CosyVoice流式推理
本文分享了`小智AI服务端 本地TTS`的实现,对`cosyvoice`的首包延时进行了实测。原创 2025-05-18 08:44:07 · 1008 阅读 · 0 评论 -
低延迟小智AI服务端搭建-本地TTS篇:fishspeech流式推理
本文分享了`小智AI服务端 本地TTS`的实现,对`fishspeech`的首包延时进行了实测。原创 2025-05-16 11:44:16 · 547 阅读 · 0 评论 -
低延迟小智AI服务端搭建-TTS篇
本文分享了`小智AI服务端 TTS`的实现,对`在线 API`的延时进行了实测,并简单测算了成本。原创 2025-04-28 09:56:10 · 1163 阅读 · 0 评论 -
低延迟小智AI服务端搭建-LLM篇
本文分享了`小智AI服务端 LLM`的实现,对`流式推理`方案的延时进行了实测。原创 2025-04-22 11:46:15 · 1075 阅读 · 1 评论 -
低延迟小智AI服务端搭建-ASR篇(续):CPU可跑
本文分享了`小智AI服务端ASR`的`CPU推理`方案,并对配置和成本进行了估算。原创 2025-04-19 07:46:07 · 1133 阅读 · 1 评论 -
低延迟小智AI服务端搭建-ASR篇
本文主要分享了`小智AI服务端ASR`的几种实现方案,对`本地部署-GPU推理`方案的配置和成本进行了估算。原创 2025-04-15 11:36:49 · 1414 阅读 · 0 评论 -
CPU实时的开源TTS引擎,支持中英混语合成,本地部署实测
本文分享了轻量级语音合成工具:`kokoro`,并进行了本地部署实测。抛开`语气 情绪`等细粒度控制不谈,`kokoro` 绝对的性价比之王!**对中文支持友好,CPU 实时可跑**,单凭这两点,强烈推荐您一试!原创 2025-03-30 08:28:42 · 2116 阅读 · 0 评论 -
定制你的DeepSeek专家:Unsloth 大模型微调教程
本文分享了开源大模型微调工具 `Unsloth`,并通过一个简单例子,带大家走完了微调deepseek qwen2.5 全流程。原创 2025-03-20 08:13:32 · 1830 阅读 · 0 评论 -
比肩满血DS,阿里开源 QwQ-32B 本地部署,Ollma/vLLM 实测对比,消费级显卡可跑,效果炸裂
本文带大家本地部署了最新开源的推理模型 `QwQ-32B`,并通过 Ollama/vLLM 进行了本地部署实测。原创 2025-03-13 09:37:47 · 2420 阅读 · 0 评论 -
最新开源TTS语音克隆,本地部署实测!跨语言、高保真。。。
最近,看到一款开源的语音合成(TTS)系统。今日分享,将介绍 `Spark-TTS`,并带大家本地部署体验,为本地 TTS 选型提供参考。原创 2025-03-10 08:38:27 · 4232 阅读 · 0 评论 -
AI加持下,如何从0到1做一个AI服务网站
对于零基础的朋友,有没有一条路径:快速把`浮现在脑海中的想法`落地到`提高生产效率的工具`?原创 2025-03-04 09:03:39 · 1206 阅读 · 0 评论 -
Nginx 助力 DeepSeek 本地部署,实现高可用、负载均衡的大模型应用
本文带大家采用 **Ollama** + **Nginx** 实现了**高可用**的大模型应用,并采用**Locust** 进行模拟压力测试。原创 2025-02-22 08:39:16 · 1493 阅读 · 0 评论 -
旧手机秒变 AI 神器:DeepSeek 离线部署,搭建个人网站,私人网盘。。。
本文分享了如何用 Termux 将旧手机打造成一款个人服务器,并尝试了本地部署 DeepSeek。原创 2025-02-19 06:59:01 · 1429 阅读 · 0 评论 -
免费GPU算力本地跑DeepSeek R1,无惧官方服务繁忙!
本文分享了如何用免费GPU 算力部署 DeepSeek 的推理模型,并内网穿透出来,任性调用。原创 2025-01-31 09:37:50 · 3782 阅读 · 0 评论 -
借 WeChatFerry 东风,我把微信机器人复活了!
本文基于 `wcf` 框架,复活了微信机器人-`小爱`,把完整实现过程捋了一遍。原创 2025-01-14 10:35:41 · 3876 阅读 · 2 评论 -
一款微信AI机器人开发框架!稳定可靠,小白友好
本文分享了一款稳定可靠的微信机器人开发框架:`wcf`,了解其基本原理并快速上手,下篇将带大家实操,从零打造`小爱`同款微信机器人。原创 2025-01-13 12:42:46 · 3164 阅读 · 0 评论 -
阿里开源TTS CosyVoice 再升级!语音克隆玩出新花样,支持流式输出,本地部署实测
最近看到阿里开源的 CosyVoice 又发布了重大更新。今日分享,将介绍 CosyVoice 2.0,并带大家本地部署体验,为本地 TTS 选型提供参考。原创 2025-01-03 08:16:52 · 11048 阅读 · 2 评论 -
4k star!升级版OneAPI,助力 Dify 兼容 OpenAI 格式
本文介绍了大模型接口管理工具-NewAPI,对 OneAPI 进行了二次开发,实现了对 Dify 的支持。除了 Dify 之外,还支持 Midjourney 绘图接口。原创 2024-12-30 08:52:44 · 4436 阅读 · 0 评论 -
17k star!开源最快语音克隆方案,FishSpeech 焕新升级,本地部署实测
本文和大家分享了一款强大的语音克隆工具:fish-speech,**从质量到速度**,相比已有开源方案,有了全方位提升。原创 2024-12-26 09:11:14 · 7772 阅读 · 5 评论 -
开源版Heygen!TANGO数字人,瞄准全身动作生成,本地部署实测
本文带大家在本地实操了支持**全身动作生成**的数字人项目 TANGO。原创 2024-12-17 08:29:34 · 7612 阅读 · 4 评论 -
开源端侧实时数字人项目,效果炸裂,附一键整合包
今日分享,给大家带来一款实时的**2.5D数字人**开源项目-UltraLight Digital Human,轻量高效,效果惊艳。原创 2024-12-13 09:54:10 · 3116 阅读 · 1 评论 -
AI全栈利器开源!带你用Ollama+Qwen2.5-Code跑bolt.new
本文带大家在本地部署了 qwen2.5-code 模型,并成功驱动 AI 编程工具 bolt.new。用它来开发前端项目还是相当给力的原创 2024-12-02 08:05:22 · 3835 阅读 · 1 评论 -
端侧多模态大模型再升级,只有968M!实测效果咋样
本文介绍了开源的端侧多模态大模型 - omnivision,有端侧使用需求的朋友可以关注。原创 2024-11-30 08:42:28 · 1451 阅读 · 0 评论 -
Coze 智能体之:零代码打造换脸表情包生成器
本文通过一个简单案例,带大家实操了**Coze 图像流**。有了这些底层能力,可玩的空间可太大了,比如制作海报、小红书爆款文案图片等。原创 2024-11-22 08:08:37 · 1046 阅读 · 0 评论 -
Dify 保姆级教程之:零代码打造图像生成专家(下)
本文带大家实操了**Dify 搭建图像生成专家**,并实现了后端调用。原创 2024-11-20 11:09:36 · 5268 阅读 · 3 评论 -
Dify 保姆级教程之:零代码打造图像生成专家(上)
本文通过综合运用`工作流`和`Agent`,带大家实操了**Dify 搭建图像生成专家**。原创 2024-11-19 10:14:13 · 4914 阅读 · 1 评论 -
永久免费语音服务!微软 Azure 注册实操,零成本实现TTS自由
本篇分享,带大家实操:**在微软 Azure 平台,注册一个语音服务,享用免费的 TTS 服务**。原创 2024-11-13 10:13:58 · 11376 阅读 · 2 评论 -
Ollama 更新!本地跑 LLama3.2,轻量级+视觉能力,能媲美GPT-4o?
本文带大家本地跑了 Meta 最新开源的 Llama 3.2,并在票据识别任务上进行了实测。原创 2024-11-12 09:48:12 · 9252 阅读 · 0 评论 -
Dify 保姆级教程之:零代码打造票据识别专家
本文通过一个简单案例,带大家实操了**Dify 搭建票据识别专家**。原创 2024-11-07 10:09:05 · 2086 阅读 · 1 评论 -
Dify 保姆级教程之:零代码打造个性化记忆助手
本文通过一个简单案例,带大家拆解并实操了**Dify 搭建个性化记忆助手**原创 2024-11-02 08:41:38 · 3815 阅读 · 0 评论 -
Dify 保姆级教程之:零代码打造 AI 搜索引擎
本文通过一个简单案例,带大家实操了**Dify 搭建 AI 搜索引擎**原创 2024-10-31 10:25:07 · 10573 阅读 · 0 评论 -
如何赋予AI Agent长期记忆?阿里开源 MemoryScope 实战,全程免费
本文带大家实操了 LLM 长期记忆框架 `MemoryScope`,为构建更加个性化的智能体,提供了一种可能。原创 2024-10-30 08:30:38 · 6355 阅读 · 2 评论 -
开源视频生成 Pyramid Flow 本地部署实测
本文带大家本地部署并实测了最新开源的视频生成模型 - `Pyramid Flow`。原创 2024-10-28 08:33:55 · 3345 阅读 · 0 评论 -
49K 下载!最强开源语音克隆TTS:本地部署实测,2秒复刻你的声音
本文带大家本地部署并实测了最新开源的语音合成/克隆工具 - `F5-TTS`。原创 2024-10-26 08:17:53 · 20121 阅读 · 7 评论 -
「AI数学老师」,一个前后端分离的小项目
本文通过引入 `Gradio`,带大家实操了`AI数学老师`的前端实现。原创 2024-10-22 08:09:40 · 726 阅读 · 0 评论 -
我把「AI数学老师」接入了「小爱」,拍照解题,微信直出
本文通过简单两步为`小爱`接入了 `AI数学题解` 的能力,你只需拍照上传图片,任性向他提问。希望这款`免费AI老师`,能帮你省下一笔家教费~原创 2024-10-16 08:24:34 · 1467 阅读 · 0 评论 -
还请什么家教,你的免费AI数学老师来了!最强OCR+数学模型Qwen-Math,本地搭建
本文带大家实操了 Qwen2.5-Math 本地部署,并搭建了小初高全覆盖的`AI数学老师`。有了它,还请什么家教,从此妈妈再也不用担心辅导娃作业啦。原创 2024-10-13 08:20:48 · 1888 阅读 · 0 评论 -
202K 下载!最强开源OCR:本地部署,邀你围观体验
GOT-OCR2.0号称将 OCR 推进到了 2.0 时代,它到底强在哪?它将大模型引入到 OCR 中,使得多样化的文本识别成为可能,包括:标准文本识别、格式化文本识别、细粒度 OCR 以及多页文档的 OCR。模型轻量:整个模型参数量只有 580M。端到端处理:模型由编码器和解码器组成。输入多样性:处理包括文本、公式、表格、图表、乐谱和几何形状在内的各种光学信号。输出灵活性:能够生成纯文本或格式化结果。支持 html 输出,非常适合给大模型食用。模型训练分为三个阶段。原创 2024-10-12 08:14:15 · 6505 阅读 · 0 评论 -
我把「国产Sora」接入了「小爱」,邀你免费体验
本文通过`本地部署 CogVideoX`,成功为`小爱`接入了`文生视频`能力。原创 2024-09-29 08:07:44 · 1203 阅读 · 0 评论