- 博客(10)
- 收藏
- 关注
原创 Ubuntu24.04/BLIP/Gradio 服务本地部署
BLIP是一种统一视觉-语言理解和生成的多模态预训练模型,通过创新的MED架构实现图像编码和文本生成功能。其核心创新包括支持三种模式的混合编码器-解码器,以及通过CapFilt方法提升数据质量。BLIP在图像描述生成、视觉问答和图像-文本检索等任务上表现优异。实际应用中,可以通过加载预训练模型实现准确的图像描述功能,但生成的描述可能较为简略。该模型支持本地部署和Gradio界面交互,为多模态任务提供了高效解决方案。
2026-01-26 11:40:59
646
原创 Ubuntu24.04/CosyVoice 2.0/Docker Compose 本地部署
CosyVoice 2.0 是阿里巴巴通义实验室开源的高性能语音生成大模型,通过创新技术显著提升语音合成的自然度、准确性与实时性。该模型基于大语言模型架构,采用流匹配解码和有限标量量化技术,实现高质量多语言语音合成,支持中文、英语、日语等9种语言及18种中文方言,其核心功能包括零样本音色克隆(仅需3-10秒音频即可复刻音色与韵律)、跨语言合成(如中文音色流畅输出英文语音)以及低延迟流式合成(首包延迟150毫秒)。在主观评测中,其MOS评分达4.6以上,接近真人水平,且发音错误率较前代降低30%-50%
2026-01-26 11:02:35
1082
原创 Ubuntu24.04/FunASR/Docker Compose 本地部署
FunASR是由阿里巴巴通义实验室开发的开源语音识别工具包,集成了语音识别(ASR)、语音活动检测(VAD)、标点恢复等功能。它支持流式和非流式识别,采用先进的Paraformer等模型架构,具有低延迟(200ms内)和高准确率特点。FunASR提供Python API和Docker部署方案,可应用于智能客服、在线教育、医疗文书等场景。通过ModelScope平台提供预训练模型,支持中英文等多种语言,并具备抗噪和领域自适应能力,便于工业级应用部署。
2026-01-23 10:19:19
1054
原创 Ubuntu24.04/Whisper/Docker Compose 本地部署
摘要 OpenAI开源的Whisper是一款基于Transformer架构的自动语音识别系统,具有强大的鲁棒性和多语言支持能力。其核心技术特点包括:端到端的Transformer架构处理30秒音频片段、在68万小时多语言数据上训练、统一的多任务格式设计。Whisper提供从tiny到large五种模型规格,适用于会议记录、视频字幕、语音翻译等多种场景。支持命令行、Python集成和API调用三种使用方式,并可通过Docker进行本地部署。该系统的核心优势在于高鲁棒性、多功能性和开放便捷性,特别适合需要处理复
2026-01-23 09:59:59
927
原创 Ubuntu24.04/Dify+Ollama 本地部署
本文介绍了Dify和Ollama的配置方法。首先通过Git拉取Dify镜像,修改环境变量和配置文件后启动服务。然后安装Ollama,配置环境变量并拉取模型。最后详细说明了如何在Dify中配置本地大模型,包括安装插件、添加工作流节点、设置LLM模型等步骤,并展示了如何查看主机IP和已安装的模型列表。文章提供了完整的配置流程,帮助用户快速搭建本地AI开发环境。
2026-01-22 11:27:05
953
原创 Ubuntuの奇妙冒险 | EasyTier 实现内网穿透以及多设备组网
本文介绍了EasyTier组网工具的安装和使用方法。在Ubuntu系统中通过下载解压软件包并添加执行权限完成安装。用户需注册账户并在不同网络环境下的设备上运行节点程序,通过Web控制台创建相同名称的网络实现组网连接。文章指出该工具操作简便但传输速度较慢(仅几百KB/s),虽然支持多节点组网是其优势,但若需使用自建服务器则不如直接配置域名方便。最后比较了EasyTier与OpenP2P在功能和性能上的差异。
2026-01-22 08:50:22
673
原创 Ubuntuの奇妙冒险 | OpenP2P 实现内网穿透 点对端传输
OpenP2P 是一款开源免费的点对点组网工具,通过共享带宽实现内网穿透和异地组网。用户注册获取Token后,可在多平台安装客户端,并通过端口转发功能,安全高效地远程访问NAS、桌面等服务
2026-01-21 09:34:24
1090
原创 Ubuntuの奇妙冒险 | 通过 Heroic Games Launcher 启动 Epic
本文介绍了在Ubuntu 24.04系统上安装和配置Heroic Games Launcher的过程。通过GitHub下载AppImage文件并运行,登录Epic账户管理游戏库。重点解决了Wine配置问题,包括安装Proton兼容版本、修改Wine前缀路径和手动安装BattlEye反作弊软件。同时配置了bubblewrap容器工具的权限设置,并解决了游戏窗口切换黑屏问题。作者最终吐槽在Linux系统上玩游戏存在配置复杂、兼容性差等问题,建议玩家还是在Windows系统上进行游戏体验。
2026-01-21 08:38:46
696
原创 Ubuntu24.04/Open WebUI+Ollama 本地部署
配置 Open WebUI 的页面搜索配置:注意开启最上面的联网搜索、配置宿主机中的 SearXNG 访问地址;否则在对话窗口中无法开启联网搜索、无法连接到 SearXNG 的服务:http://host.docker.internal:8080/search?修改配置文件:由于本地已经运行了 Ollama 服务,所以需要修改docker-compose.yaml以及.env文件中关于 Ollama 的配置。开启联网搜索:由于硬件以及模型的限制,虽然进行了联网搜索,但是结果不尽人意;目前无法联网(废话)
2026-01-20 15:54:37
1298
原创 Ubuntu24.04/中文版n8n/docker compose 部署
n8n是一款开源可视化工作流自动化平台,支持300+应用集成,通过拖放节点实现低代码自动化。其核心优势包括开源自托管、可视化操作、丰富集成能力和灵活触发方式,适用于营销自动化、数据同步、客户服务等场景。部署方案提供标准Docker Compose配置和中文优化版本,包含PostgreSQL数据库支持、数据持久化等生产级配置建议,并详细说明环境变量设置和健康检查机制。中文版通过替换UI组件实现本地化,解决了官方版本中文支持不足的问题。
2026-01-20 15:05:14
1250
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅