- 博客(1014)
- 收藏
- 关注
原创 DeepSeek-R1-0528-Qwen3-8B 本地ollama离线运行使用和llamafactory lora微调
支持直接下载:Ollama拉取huggingface社区或modelscope社区的GGUF模型并部署。
2025-05-30 11:39:26
773
原创 ollama国内安装使用
国内用户安装Ollama时可能遇到下载慢和安装卡顿问题,可通过以下方式解决:1) 使用Docker镜像安装最新版;2) 通过GitHub镜像加速服务修改安装脚本;3) 使用ModelScope平台安装(目前仅支持0.7版本)。三种方法均能有效提升国内下载速度,具体选择取决于用户需求和环境限制。
2025-05-30 11:24:13
377
原创 KWS 唤醒服务vosk代码实现
本文介绍如何使用Vosk库实现中文语音唤醒功能。主要内容包括:1) 下载Vosk中文语音模型;2) 安装Vosk和PyAudio库;3) 提供核心代码示例,展示如何初始化语音识别器、设置唤醒词"你好"并实时监听麦克风输入;4) 当检测到唤醒词时触发相应操作。代码实现了音频流处理、语音识别和唤醒词检测功能,并包含资源清理逻辑。该方案适合开发语音交互应用,可扩展添加唤醒后的自定义操作。
2025-05-27 16:58:41
228
原创 MCP 纯python代码实现client客户端代码案例
摘要: 该代码实现了一个基于阿里云DashScope API的智能助手客户端SimpleMCPClient,支持多轮对话和工具调用。助手通过分析用户问题,动态选择调用搜索、计算或天气查询工具,整合结果后生成最终回复。核心功能包括工具初始化(_init_tools)、工具执行(_execute_tool)和异步对话处理(chat),通过最多5轮迭代实现逐步推理。示例中展示了如何通过系统提示定义工作流程,并模拟工具调用(如web_search返回固定结果)。该设计适用于需要结合外部工具增强回复准确性的场景。 (
2025-05-26 10:29:18
271
原创 MCP优秀案例与服务分享:图表生成mcp-server-chart、声音图片视频生成MiniMax-MCP、文档生成Skywork-Super-Agents
本文介绍了几个基于MCP(Model-Controller-Presenter)架构的开源项目,涵盖了图表生成、多媒体内容生成以及文档生成等功能。首先,mcp-server-chart项目通过简单的配置即可生成图表,适合数据可视化需求。其次,MiniMax-MCP项目专注于声音、图片和视频的生成,提供了丰富的案例展示。最后,Skywork-Super-Agents项目则用于生成文档、幻灯片和表格,提升了文档处理的效率。这些项目展示了MCP架构在不同领域的应用潜力,开发者可以根据需求选择合适的工具进行开发。
2025-05-23 09:42:46
320
原创 AI前端页面生成:deepsite、Qwen Web Dev
本文介绍了两个基于AI的网页生成工具:deepsite和Qwen Web Dev。deepsite利用Hugging Face的推理API,结合DeepSeek-V3-0324模型生成HTML内容,默认使用TailwindCSS实现样式,确保输出为单HTML文件,并通过CDN加载TailwindCSS。Qwen Web Dev则支持直接部署,提供了多个部署示例,展示了其灵活性和易用性。这两个工具都强调了AI在网页生成中的核心作用,分别通过不同的技术栈实现高效、美观的网页生成。
2025-05-20 09:07:18
109
原创 agent 智能体应用产品:生图、生视频、代码等
本文介绍了多个AI领域的创新产品。Lovart是全球首个设计Agent,专注于设计领域的智能化应用。Medeo是一款AI视频Agent产品,旨在提升视频处理效率。在代码开发领域,vscode copilot、cursor和trae等工具为开发者提供了智能辅助功能。此外,manus等研究项目也在推动AI技术的进步。各大模型产品如grok等,展示了AI在不同领域的广泛应用和持续创新。这些产品和研究共同推动了AI技术的发展,为各行业带来了新的可能性。
2025-05-16 14:54:29
180
原创 FastAPI 接收远程文件上传功能
FastAPI 提供了简单的方式来处理远程文件上传,通常通过 multipart/form-data 格式。使用 File 和 UploadFile 可以轻松接收和处理上传的文件。以下是一个基础示例,展示了如何接收文件并将其保存到服务器:
2025-05-09 10:40:52
236
原创 MCP 自定义python实现client客户端服务,function call调用方式
参考MCP 自定义python实现server服务:https://blog.csdn.net/weixin_42357472/article/details/147624899。
2025-05-06 10:58:59
238
原创 超级agent智能体助手:全自动个人助手
扣子空间:https://www.coze.cn/space-preview。Genspark、Manus和OpenAI Deep Research。
2025-04-23 09:14:57
210
原创 智能体MCP 实现数据可视化分析
参考:WPS软件上的表格分析阿里mcp:https://developer.aliyun.com/article/1661198 (搜索加可视化)
2025-04-22 14:58:16
5991
原创 大模型LLM表格报表分析:markitdown文件转markdown,大模型markdown统计分析
整体流程:用markitdown工具文件转markdown,然后大模型markdown统计分析。
2025-04-12 20:43:08
781
原创 langchain 搭建MCP客户端自动调用MCP应用案例
参考:https://deepseek.csdn.net/67f1e1afeb072863e39c011d.htmlMCP服务端应用创建一个python文件,命名为math_server.pyMCP客户端创建一个python文件,命名为math_client.py运行使用先运行math_server.py,再运行math_client.py,进行AI对话,观察日志输出结果,确定是否调用了自定义的MCP Server服务
2025-04-11 14:28:23
163
原创 dify 上传文件code模块读取;沙盒包安装
将需要的依赖放入/docker/volumes/sandbox/dependencies/python-requirements.txt,重启sandbox即可。requirements.txt文件中指定源:-i https://pypi.tuna.tsinghua.edu.cn/simple。在官方 docker-compose.yaml 中,找到 sandbox 的 image 部分内容,替换镜像即可。修改docker-compose.yaml ,修改完docker compose up。
2025-04-01 14:45:28
787
原创 TxGemma Ai加速药物开发模型
参考:Tx-LLM,这是一种经过微调的语言模型,用于预测整个治疗开发管道中生物实体的属性,从早期目标发现到后期临床试验批准。
2025-03-31 11:30:40
172
原创 MCP Server开发自定义案例-python版
参考:https://www.cnblogs.com/ryanzheng/p/18781666https://www.cnblogs.com/mingupupu/p/18745928https://github.com/modelcontextprotocol/python-sdkserver_test.py用上mcp.run()就可以python运行windows配置
2025-03-25 15:07:48
445
3
原创 uv包简单使用案例
uv由Charlie Marsh开发,是Astral Tool的一个快速Python包安装器和解析器。它类似于pip和pip-tools,但速度更快。此外,uv还支持虚拟环境管理,替代venv和virtualenv。参考:https://github.com/astral-sh/uv。
2025-03-25 09:03:44
1225
原创 大模型mardown数据转换: 各种文件数据转换markitdown、网页数据转换llms.txt
robots.txt 和 sitemap.xml 是为搜索引擎设计的,而 LLMs.txt 是面向推理引擎优化,它以 LLM 可以轻松理解的格式向 LLM 提供有关网站的信息。参考https://github.com/microsoft/markitdown。/llms.txt: 简化的文档导航视图,帮助 AI 系统快速理解站点的结构。包转换:https://github.com/dotenvx/llmstxt。在线:https://llmstxt.firecrawl.dev/
2025-03-20 09:02:34
364
原创 browser_use 自动化浏览器agent使用案例
需要更改系统prompt, extend_system_message版本还没更新肯呢个需要先设置https://github.com/browser-use/browser-use/blob/main/browser_use/agent/system_prompt.md。主要使用deepseek模型没有图像能力,需要设置use_vision=False浏览器才不会是空白。task直接这里提示用baidu.com即可。
2025-03-17 11:47:47
847
原创 ollama gemma3离线使用案例
参考:hl=zh-cn支持图像文本输入,窗口12万8下载:ollama run gemma3 (4b默认) 首先升级ollama。
2025-03-13 09:55:32
806
原创 google 图像生成imageFX、Gemini2多模态大模型直接输出图片
labs.google也有音乐视频等ai工具。每次新的内容生成在新的会话里,不然会混淆冲突。支持图像编辑、动漫连续故事生成。
2025-03-13 08:53:05
212
原创 cline mcp智能体应用使用案例
1、windows 遇到:Connect MCP Servers error"spawn npx enoent" 错误。MCP是一种协议,cline、claude等相当于客服端,调用mcp相关服务器应用(各种智能体工具)参考:https://github.com/cline/cline/issues/1948。MCP客服端(cline)相当于浏览器,MCP服务器(各种智能体工具)相当于独立网站应用。vscode 下载插件安装cline。cline市场查看安装mcp服务器。首先设置cline模型底座。
2025-03-12 17:39:37
492
原创 Kokoro-82M TTS 实时语音合成api案例
参考:支持语言与声音:https://huggingface.co/hexgrad/Kokoro-82M/blob/main/VOICES.md1.0版本z中文f女生m男生。
2025-02-28 14:48:22
505
原创 LLM大模型通过Mixture-of-LoRAs引入支持多模态Phi-4-multimodal-instruct
语音和图像分别作为独立的lora,然后MOE形式可以选择走具体路线。结合了MOE框架实现。
2025-02-27 09:22:09
111
原创 BioEmu 扩散模型加速传统分子动力学(MD)模拟
BioEmu 是一种创新的生成式深度学习系统,通过高效采样和准确预测蛋白质的动态机制,为蛋白质科学和药物设计提供了新的工具。它在多构象采样、MD 模拟拟合和蛋白质稳定性预测方面表现出色,同时显著降低了计算成本。BioEmu 的开发为未来蛋白质动态研究和应用奠定了坚实基础。
2025-02-21 09:05:34
78
原创 google 多模态aistudio Stream Realtime体验
参考:使用gemini多模态能力,支持语音图像文字输入输出,实时交互体验。
2025-02-08 23:17:45
474
2
原创 unsloth GRPO强化训练自己的离线R1 reasoning model;Qwen2.5 1.5B训练案例
参考:1、使用15 GB VRAM,Unsloth允许您将多达15 B参数的任何模型(如Llama 3.1(8B),Phi-4(14 B),Mistral(7 B)或Qwen2.5(7 B))转换为推理模型2、请注意,这不是对DeepSeek的R1蒸馏模型进行微调,也不是使用R1的蒸馏数据进行Unsloth已经支持的调优。这是使用GRPO将标准模型转换为成熟的推理模型。
2025-02-07 09:18:42
441
unidic-mecab 字符文件unidic-3.1.0下载
2024-03-01
中文语音唤醒模型sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01 (C
2024-03-01
yolov9 自有数据训练代码参考
2024-03-01
diffusers-flask-streamlit AIGC文生图代码案例,前端后端代码
2024-03-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人