AI实战_AI码上来的博客-CSDN博客

AI实战

关注

文章平均质量分 92

记录AI学习和实战过程中的一些踩坑经验和思路梳理

关注数：文章数：85 文章阅读量：540614 文章收藏量：3409

作者: AI码上来

AI全栈工程师，一个每时每刻都想和你分享干货的AI狂热分子。欢迎围观公众号：猴哥的AI知识库

展开

SparkTTS 音色克隆 + vLLM INT8量化加速推理

本文分享了`小智AI服务端本地TTS`的实现，对 `SparkTTS` 采用 vLLM 进行推理加速，并实践了 INT8 量化，最后对首包延时进行了实测。

原创 2025-05-20 11:38:18 · 450 阅读 · 0 评论
低延迟小智AI服务端搭建-本地TTS篇：CosyVoice流式推理

本文分享了`小智AI服务端本地TTS`的实现，对`cosyvoice`的首包延时进行了实测。

原创 2025-05-18 08:44:07 · 1008 阅读 · 0 评论
低延迟小智AI服务端搭建-本地TTS篇：fishspeech流式推理

本文分享了`小智AI服务端本地TTS`的实现，对`fishspeech`的首包延时进行了实测。

原创 2025-05-16 11:44:16 · 547 阅读 · 0 评论
低延迟小智AI服务端搭建-TTS篇

本文分享了`小智AI服务端 TTS`的实现，对`在线 API`的延时进行了实测，并简单测算了成本。

原创 2025-04-28 09:56:10 · 1163 阅读 · 0 评论
低延迟小智AI服务端搭建-LLM篇

本文分享了`小智AI服务端 LLM`的实现，对`流式推理`方案的延时进行了实测。

原创 2025-04-22 11:46:15 · 1075 阅读 · 1 评论
低延迟小智AI服务端搭建-ASR篇（续）：CPU可跑

本文分享了`小智AI服务端ASR`的`CPU推理`方案，并对配置和成本进行了估算。

原创 2025-04-19 07:46:07 · 1133 阅读 · 1 评论
低延迟小智AI服务端搭建-ASR篇

本文主要分享了`小智AI服务端ASR`的几种实现方案，对`本地部署-GPU推理`方案的配置和成本进行了估算。

原创 2025-04-15 11:36:49 · 1414 阅读 · 0 评论
CPU实时的开源TTS引擎，支持中英混语合成，本地部署实测

本文分享了轻量级语音合成工具：`kokoro`，并进行了本地部署实测。抛开`语气情绪`等细粒度控制不谈，`kokoro` 绝对的性价比之王！**对中文支持友好，CPU 实时可跑**，单凭这两点，强烈推荐您一试！

原创 2025-03-30 08:28:42 · 2116 阅读 · 0 评论
定制你的DeepSeek专家：Unsloth 大模型微调教程

本文分享了开源大模型微调工具 `Unsloth`，并通过一个简单例子，带大家走完了微调deepseek qwen2.5 全流程。

原创 2025-03-20 08:13:32 · 1830 阅读 · 0 评论
比肩满血DS，阿里开源 QwQ-32B 本地部署，Ollma/vLLM 实测对比，消费级显卡可跑，效果炸裂

本文带大家本地部署了最新开源的推理模型 `QwQ-32B`，并通过 Ollama/vLLM 进行了本地部署实测。

原创 2025-03-13 09:37:47 · 2420 阅读 · 0 评论
最新开源TTS语音克隆，本地部署实测！跨语言、高保真。。。

最近，看到一款开源的语音合成（TTS）系统。今日分享，将介绍 `Spark-TTS`，并带大家本地部署体验，为本地 TTS 选型提供参考。

原创 2025-03-10 08:38:27 · 4232 阅读 · 0 评论
AI加持下，如何从0到1做一个AI服务网站

对于零基础的朋友，有没有一条路径：快速把`浮现在脑海中的想法`落地到`提高生产效率的工具`？

原创 2025-03-04 09:03:39 · 1206 阅读 · 0 评论
Nginx 助力 DeepSeek 本地部署，实现高可用、负载均衡的大模型应用

本文带大家采用 **Ollama** + **Nginx** 实现了**高可用**的大模型应用，并采用**Locust** 进行模拟压力测试。

原创 2025-02-22 08:39:16 · 1493 阅读 · 0 评论
旧手机秒变 AI 神器：DeepSeek 离线部署，搭建个人网站，私人网盘。。。

本文分享了如何用 Termux 将旧手机打造成一款个人服务器，并尝试了本地部署 DeepSeek。

原创 2025-02-19 06:59:01 · 1429 阅读 · 0 评论
免费GPU算力本地跑DeepSeek R1，无惧官方服务繁忙！

本文分享了如何用免费GPU 算力部署 DeepSeek 的推理模型，并内网穿透出来，任性调用。

原创 2025-01-31 09:37:50 · 3782 阅读 · 0 评论
借 WeChatFerry 东风，我把微信机器人复活了！

本文基于 `wcf` 框架，复活了微信机器人-`小爱`，把完整实现过程捋了一遍。

原创 2025-01-14 10:35:41 · 3876 阅读 · 2 评论
一款微信AI机器人开发框架！稳定可靠，小白友好

本文分享了一款稳定可靠的微信机器人开发框架：`wcf`，了解其基本原理并快速上手，下篇将带大家实操，从零打造`小爱`同款微信机器人。

原创 2025-01-13 12:42:46 · 3164 阅读 · 0 评论
阿里开源TTS CosyVoice 再升级！语音克隆玩出新花样，支持流式输出，本地部署实测

最近看到阿里开源的 CosyVoice 又发布了重大更新。今日分享，将介绍 CosyVoice 2.0，并带大家本地部署体验，为本地 TTS 选型提供参考。

原创 2025-01-03 08:16:52 · 11048 阅读 · 2 评论
4k star！升级版OneAPI，助力 Dify 兼容 OpenAI 格式

本文介绍了大模型接口管理工具-NewAPI，对 OneAPI 进行了二次开发，实现了对 Dify 的支持。除了 Dify 之外，还支持 Midjourney 绘图接口。

原创 2024-12-30 08:52:44 · 4436 阅读 · 0 评论
17k star！开源最快语音克隆方案，FishSpeech 焕新升级，本地部署实测

本文和大家分享了一款强大的语音克隆工具：fish-speech，**从质量到速度**，相比已有开源方案，有了全方位提升。

原创 2024-12-26 09:11:14 · 7772 阅读 · 5 评论
开源版Heygen！TANGO数字人，瞄准全身动作生成，本地部署实测

本文带大家在本地实操了支持**全身动作生成**的数字人项目 TANGO。

原创 2024-12-17 08:29:34 · 7612 阅读 · 4 评论
开源端侧实时数字人项目，效果炸裂，附一键整合包

今日分享，给大家带来一款实时的**2.5D数字人**开源项目-UltraLight Digital Human，轻量高效，效果惊艳。

原创 2024-12-13 09:54:10 · 3116 阅读 · 1 评论
AI全栈利器开源！带你用Ollama+Qwen2.5-Code跑bolt.new

本文带大家在本地部署了 qwen2.5-code 模型，并成功驱动 AI 编程工具 bolt.new。用它来开发前端项目还是相当给力的

原创 2024-12-02 08:05:22 · 3835 阅读 · 1 评论
端侧多模态大模型再升级，只有968M！实测效果咋样

本文介绍了开源的端侧多模态大模型 - omnivision，有端侧使用需求的朋友可以关注。

原创 2024-11-30 08:42:28 · 1451 阅读 · 0 评论
Coze 智能体之：零代码打造换脸表情包生成器

本文通过一个简单案例，带大家实操了**Coze 图像流**。有了这些底层能力，可玩的空间可太大了，比如制作海报、小红书爆款文案图片等。

原创 2024-11-22 08:08:37 · 1046 阅读 · 0 评论
Dify 保姆级教程之：零代码打造图像生成专家（下）

本文带大家实操了**Dify 搭建图像生成专家**，并实现了后端调用。

原创 2024-11-20 11:09:36 · 5268 阅读 · 3 评论
Dify 保姆级教程之：零代码打造图像生成专家（上）

本文通过综合运用`工作流`和`Agent`，带大家实操了**Dify 搭建图像生成专家**。

原创 2024-11-19 10:14:13 · 4914 阅读 · 1 评论
永久免费语音服务！微软 Azure 注册实操，零成本实现TTS自由

本篇分享，带大家实操：**在微软 Azure 平台，注册一个语音服务，享用免费的 TTS 服务**。

原创 2024-11-13 10:13:58 · 11376 阅读 · 2 评论
Ollama 更新！本地跑 LLama3.2，轻量级+视觉能力，能媲美GPT-4o？

本文带大家本地跑了 Meta 最新开源的 Llama 3.2，并在票据识别任务上进行了实测。

原创 2024-11-12 09:48:12 · 9252 阅读 · 0 评论
Dify 保姆级教程之：零代码打造票据识别专家

本文通过一个简单案例，带大家实操了**Dify 搭建票据识别专家**。

原创 2024-11-07 10:09:05 · 2086 阅读 · 1 评论
Dify 保姆级教程之：零代码打造个性化记忆助手

本文通过一个简单案例，带大家拆解并实操了**Dify 搭建个性化记忆助手**

原创 2024-11-02 08:41:38 · 3815 阅读 · 0 评论
Dify 保姆级教程之：零代码打造 AI 搜索引擎

本文通过一个简单案例，带大家实操了**Dify 搭建 AI 搜索引擎**

原创 2024-10-31 10:25:07 · 10573 阅读 · 0 评论
如何赋予AI Agent长期记忆？阿里开源 MemoryScope 实战，全程免费

本文带大家实操了 LLM 长期记忆框架 `MemoryScope`，为构建更加个性化的智能体，提供了一种可能。

原创 2024-10-30 08:30:38 · 6355 阅读 · 2 评论
开源视频生成 Pyramid Flow 本地部署实测

本文带大家本地部署并实测了最新开源的视频生成模型 - `Pyramid Flow`。

原创 2024-10-28 08:33:55 · 3345 阅读 · 0 评论
49K 下载！最强开源语音克隆TTS：本地部署实测，2秒复刻你的声音

本文带大家本地部署并实测了最新开源的语音合成/克隆工具 - `F5-TTS`。

原创 2024-10-26 08:17:53 · 20121 阅读 · 7 评论
「AI数学老师」，一个前后端分离的小项目

本文通过引入 `Gradio`，带大家实操了`AI数学老师`的前端实现。

原创 2024-10-22 08:09:40 · 726 阅读 · 0 评论
我把「AI数学老师」接入了「小爱」，拍照解题，微信直出

本文通过简单两步为`小爱`接入了 `AI数学题解` 的能力，你只需拍照上传图片，任性向他提问。希望这款`免费AI老师`，能帮你省下一笔家教费~

原创 2024-10-16 08:24:34 · 1467 阅读 · 0 评论
还请什么家教，你的免费AI数学老师来了！最强OCR+数学模型Qwen-Math，本地搭建

本文带大家实操了 Qwen2.5-Math 本地部署，并搭建了小初高全覆盖的`AI数学老师`。有了它，还请什么家教，从此妈妈再也不用担心辅导娃作业啦。

原创 2024-10-13 08:20:48 · 1888 阅读 · 0 评论
202K 下载！最强开源OCR：本地部署，邀你围观体验

GOT-OCR2.0号称将 OCR 推进到了 2.0 时代，它到底强在哪？它将大模型引入到 OCR 中，使得多样化的文本识别成为可能，包括：标准文本识别、格式化文本识别、细粒度 OCR 以及多页文档的 OCR。模型轻量：整个模型参数量只有 580M。端到端处理：模型由编码器和解码器组成。输入多样性：处理包括文本、公式、表格、图表、乐谱和几何形状在内的各种光学信号。输出灵活性：能够生成纯文本或格式化结果。支持 html 输出，非常适合给大模型食用。模型训练分为三个阶段。

原创 2024-10-12 08:14:15 · 6505 阅读 · 0 评论
我把「国产Sora」接入了「小爱」，邀你免费体验

本文通过`本地部署 CogVideoX`，成功为`小爱`接入了`文生视频`能力。

原创 2024-09-29 08:07:44 · 1203 阅读 · 0 评论

AI实战

作者: AI码上来

SparkTTS 音色克隆 + vLLM INT8量化加速推理

低延迟小智AI服务端搭建-本地TTS篇：CosyVoice流式推理

低延迟小智AI服务端搭建-本地TTS篇：fishspeech流式推理

低延迟小智AI服务端搭建-TTS篇

低延迟小智AI服务端搭建-LLM篇

低延迟小智AI服务端搭建-ASR篇（续）：CPU可跑

低延迟小智AI服务端搭建-ASR篇

CPU实时的开源TTS引擎，支持中英混语合成，本地部署实测

定制你的DeepSeek专家：Unsloth 大模型微调教程

比肩满血DS，阿里开源 QwQ-32B 本地部署，Ollma/vLLM 实测对比，消费级显卡可跑，效果炸裂

最新开源TTS语音克隆，本地部署实测！跨语言、高保真。。。

AI加持下，如何从0到1做一个AI服务网站

Nginx 助力 DeepSeek 本地部署，实现高可用、负载均衡的大模型应用

旧手机秒变 AI 神器：DeepSeek 离线部署，搭建个人网站，私人网盘。。。

免费GPU算力本地跑DeepSeek R1，无惧官方服务繁忙！

借 WeChatFerry 东风，我把微信机器人复活了！

一款微信AI机器人开发框架！稳定可靠，小白友好

阿里开源TTS CosyVoice 再升级！语音克隆玩出新花样，支持流式输出，本地部署实测

4k star！升级版OneAPI，助力 Dify 兼容 OpenAI 格式

17k star！开源最快语音克隆方案，FishSpeech 焕新升级，本地部署实测

开源版Heygen！TANGO数字人，瞄准全身动作生成，本地部署实测

开源端侧实时数字人项目，效果炸裂，附一键整合包

AI全栈利器开源！带你用Ollama+Qwen2.5-Code跑bolt.new

端侧多模态大模型再升级，只有968M！实测效果咋样

Coze 智能体之：零代码打造换脸表情包生成器

Dify 保姆级教程之：零代码打造图像生成专家（下）

Dify 保姆级教程之：零代码打造图像生成专家（上）

永久免费语音服务！微软 Azure 注册实操，零成本实现TTS自由

Ollama 更新！本地跑 LLama3.2，轻量级+视觉能力，能媲美GPT-4o？

Dify 保姆级教程之：零代码打造票据识别专家

Dify 保姆级教程之：零代码打造个性化记忆助手

Dify 保姆级教程之：零代码打造 AI 搜索引擎

如何赋予AI Agent长期记忆？阿里开源 MemoryScope 实战，全程免费

开源视频生成 Pyramid Flow 本地部署实测

49K 下载！最强开源语音克隆TTS：本地部署实测，2秒复刻你的声音

「AI数学老师」，一个前后端分离的小项目

我把「AI数学老师」接入了「小爱」，拍照解题，微信直出

还请什么家教，你的免费AI数学老师来了！最强OCR+数学模型Qwen-Math，本地搭建

202K 下载！最强开源OCR：本地部署，邀你围观体验

我把「国产Sora」接入了「小爱」，邀你免费体验