自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(940)
  • 收藏
  • 关注

原创 Ubuntu 安装和使用 Fcitx 中文输入法;截图软件flameshot

在 Ubuntu 上安装和使用 Fcitx 输入法框架是一个常见的选择,特别是对于需要中文输入的用户。

2024-09-21 10:33:45 1474 1

原创 RAG新思路降低检索错误率:为文档划分的每个块进行大模型上下文构建

【代码】RAG新思路降低检索错误率:为文档划分的每个块进行大模型上下文构建。

2024-09-20 16:58:07 81

原创 稀疏向量 milvus存储检索RAG使用案例

暂时只能在linux ubuntu或mac上使用,因为windows、centos暂时不支持milvus_lite:https://github.com/milvus-io/milvus/issues/34854。

2024-09-20 15:12:20 500

原创 AI免费UI页面生成

界面和claude类似,右侧展示效果和代码。

2024-09-19 16:29:21 327

原创 vllm 部署qwen2.5-7b;opeanai 接口访问、requests接口

参考:https://qwenlm.github.io/zh/blog/qwen2.5/https://huggingface.co/Qwen/Qwen2.5-7B-Instruct下载:vllm部署:流式非流式

2024-09-19 13:26:02 577

原创 qwen2.5 vllm推理;openai function call调用中文离线agents使用

参考:运行:运行调用tools报错,qwen官方说会尽快修复增加 /ai/template.jinja 文件。

2024-09-19 12:46:28 1029 1

原创 BGE-M3稠密向量、稀疏向量使用案例;bge-reranker使用案例

【代码】BGE-M3稠密向量、稀疏向量使用案例。

2024-09-19 11:23:20 510

原创 免费AI播客生成:notebooklm可以生成播客的两个发言人谈论的内容,从各种来源如研究论文、文章

另外notebooklm他本身也是个rag知识库对话,可以直接聊天框对话。

2024-09-15 10:19:48 220

原创 OCR识别小模型:GOT-OCR2

【代码】OCR识别小模型:GOT-OCR2。

2024-09-14 13:57:18 997

原创 pytorch qwen2-vl自定义数据全量微调

参考:https://github.com/zhangfaen/finetune-Qwen2-VL/tree/main。运行模型保存在:train_output下。2B显存训练也很高,4090卡训练的。安装特定包,对qwen2vl支持。

2024-09-14 10:29:22 677

原创 cursor AI代码编辑器IDE对接本地模型deepseek

参考:https://www.cursor.com/https://platform.deepseek.com/https://www.cursor.com/下载安装后,注册账号登录即可再高级里选择设置再模型这注册模型:模型名称一定要填正确,url地址填好,最后填上秘钥验证

2024-09-13 09:47:04 2468

原创 reader-lm:小模型 html转markdown

输入网址:https://www.galaxy-geely.com/E5。

2024-09-12 19:13:21 624

原创 claude:prompt新奇使用方法

下面prompt大概定义了4个函数,第一个算是system定义,中间二个是需要他执行的东西,最后一个是入口;另外测试claude使用较好,可以直接调用前端显示,svg图片下载,,deepseek效果一般。参考:https://web.okjike.com/originalPost/66e170618becdf39a1c19761。

2024-09-12 13:45:31 481

原创 Chai-1:药物分子结构预测的新型多模态基础模型

它在各种与药物发现相关的任务中都表现出色,包括蛋白质-配体结构预测和蛋白质多聚体预测。Chai-1可以选择性地使用实验约束来实现更准确的预测,并且无需多序列比对(MSA)也能做出强大的预测。Chai-1在各种折叠任务上都取得了最先进的性能,包括配体姿态预测、蛋白质-蛋白质和抗体-蛋白质复合物预测以及单体蛋白质预测3。Chai-1的架构主要遵循之前的工作,但增加了一些新功能,如使用大型蛋白质语言模型的嵌入特征,以及约束特征(如口袋、接触和对接约束)来捕捉实验数据39。

2024-09-12 11:34:43 321

原创 swift qwen2-vl推理及加载lora使用案例

参考:SWIFT支持300+ LLM和50+ MLLM(多模态大模型)的训练(预训练、微调、对齐)、推理、评测和部署。

2024-09-12 10:07:27 768

原创 swift:qwen2 VL 多模态图文模型lora微调swift

【代码】swift:qwen2 VL 多模态图文模型lora微调swift。

2024-09-11 21:04:57 748

原创 qwen2 VL 多模态图文模型;图像、视频使用案例

【代码】qwen2 VL 多模态图文模型;图像、视频使用案例。

2024-09-11 12:57:28 863

原创 github actions CICD简单使用案例

参考:https://developer.aliyun.com/article/1540773https://github.com/ViggoZ/producthunt-daily-hot/blob/main/.github/workflows/generate_markdown.yml目录:.github/workflows/fetch-news.yml actions执行yaml(必须这样的目录结构)fetch-news.py 是python脚本fetch-news.py2、构建

2024-09-08 12:32:01 900

原创 transformers多agents调用使用离线大LLM:MiniCPM3模型

【代码】多agents调用使用离线大LLM:MiniCPM3模型。

2024-09-06 16:32:25 172

原创 MiniCPM3-4B 大模型安装vllm推理使用;transformers function call agent使用案例

参考:https://github.com/OpenBMB/MiniCPM下载模型:环境安装:

2024-09-06 15:34:57 289

原创 flux 文生图大模型 自有数据集 lora微调训练案例

数据集:https://huggingface.co/datasets/quocanh34/itay-hires-lora-dataset-v2。国内https://modelscope.cn/models/ai-modelscope/flux.1-dev/files。模型地址:name_or_path;待支持:https://github.com/kohya-ss/sd-scripts/X-LABS 的https://github.com/XLabs-AI/x-flux。1)首先填写配置文件。

2024-09-04 17:37:05 629

原创 vercel免费在线部署TodoList网页应用

参考:TodoList网页应用:https://blog.csdn.net/weixin_42357472/article/details/140909096。

2024-09-01 21:34:39 309

原创 flux bitsandbytes bnb量化;diffusers 15G显卡加载使用

大概需要13G多,t4卡推理一张图需要3-4分左右时间。huggingface-cli login 登录。对text模块bnb量化。

2024-09-01 17:32:59 398

原创 diffusion 模型gguf量化使用案例,支持CPU运行

参考:https://github.com/leejet/stable-diffusion.cpp模型下载,大小4G左右推理,大概需要2G左右显存

2024-08-31 20:07:51 232

原创 flux 文生图bnb量化模型diffusers使用案例

参考:https://huggingface.co/black-forest-labs/FLUX.1-devhttps://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/1079https://github.com/huggingface/diffusers/issues/9149https://huggingface.co/lllyasviel/flux1-dev-bnb-nf4/tree/main下载单个模型:bit

2024-08-31 10:20:17 1077

原创 Aria2 多线程下载器

Aria2 是一个轻量级的多协议、多来源命令行下载工具。它支持 HTTP/HTTPS、FTP、BitTorrent 和 Metalink 协议。Aria2 可以通过 JSON-RPC 和 XML-RPC 接口进行远程控制。

2024-08-31 09:58:37 1514

原创 vllm 推理qwen gguf模型使用案例;openai接口调用、requests调用

vllm 推理qwen gguf模型使用案例;openai接口调用、requests调用

2024-08-29 11:51:26 167

原创 transformers quantization bitsandbytes实时量化方法使用load_in_4bit,load_in_8bit;量化模型保存及加载使用

参考:https://huggingface.co/docs/transformers/main/en/quantization/bitsandbytes?bnb=8-bithttps://www.atyun.com/57101.htmlhttps://huggingface.co/blog/4bit-transformers-bitsandbytesbitsandbytes错误参考:https://cnloong.blog.csdn.net/article/details/141607933使用q

2024-08-28 17:10:48 283

原创 PEFT qwen2 lora微调模型训练案例

参考:https://github.com/huggingface/peft##文档https://huggingface.co/docs/peft/indexhttps://www.wehelpwin.com/article/4299https://www.ethanzhang.xyz/2024/07/09/%E3%80%90%E4%B8%AA%E4%BA%BA%E5%8D%9A%E5%AE%A2%E3%80%91%E4%BD%BF%E7%94%A8huggingface%E5%9C%A8%E5%8

2024-08-28 09:26:58 831

原创 bitsandbytes使用错误:CUDA Setup failed despite GPU being available

参考:https://huggingface.co/docs/bitsandbytes/main/en/installation报错信息版本:Cuda本身拥有两个API,分别是cuda driver version 和 cuda runtime version。1、nvidia-smi查看的是cuda driver version版本(如图1)

2024-08-27 19:31:32 264

原创 CentOS7配置阿里yum源:Could not retrieve mirrorlist http://mirrorlist.centos.org?arch=x86_64&release=7&rep

参考:https://developer.aliyun.com/article/1366034步骤vim CentOS-SCLo-scl-rh.repo 添加内容EPEL(Extra Packages for Enterprise Linux)是一个由 Fedora 社区维护的仓库,旨在为 Red Hat Enterprise Linux(RHEL)及其衍生版本(如 CentOS 和 Scientific Linux)提供额外的软件包。

2024-08-27 18:06:53 712 1

原创 autogen studio agents可视化编排使用

自定义agent,同时模型记得更换。多agent编排组织实现自定义功能。本文章windows平台测试。支持添加离线vllm模型。2)自定义agent。

2024-08-26 14:32:14 70

原创 pytorch FSDP分布式训练minist案例

它的主要目标是解决在多GPU和多节点环境下训练大型模型的内存效率问题。FSDP通过将模型的参数、梯度和优化器状态分片到多个GPU上,从而允许在有限的内存资源下训练更大的模型。优化器状态分片:优化器的状态也会被分片,每个GPU只维护与其参数分片对应的优化器状态。梯度分片:梯度也会被分片,每个GPU只计算和存储与其参数分片对应的梯度。参数分片:将模型的参数分片到多个GPU上,每个GPU只保存一部分参数。通信优化:通过减少通信量和优化通信模式,提高训练效率。fsdp这份代码训练是在单机多卡,两卡上运行的。

2024-08-26 10:25:53 250

原创 autogen agent使用框架案例调用ollama、vllm模型接口

参考:https://github.com/microsoft/autogenhttps://microsoft.github.io/autogen/docs/topics/non-openai-models/local-vllm安装:pyautogen-0.2.35openai-1.24.01) ollama2)vllm制定一个从哈尔滨去北京旅游5天的计划,我们可以按照以下日程进行规划:请根据个人兴趣和实际情况调整行程, 确保有充足的休息时间,同时关注天气 预报和交通状况,以确保旅行的顺利

2024-08-23 11:20:40 252

原创 AI搜索产品:秘塔、天工、perplexity、felo、360AI搜索、bilin

https://metaso.cn/https://www.tiangong.cn/https://www.perplexity.ai/https://felo.ai/search

2024-08-21 22:56:47 665

原创 计算机四个方面:计算、存储、通信与程序;操作系统

计算:关注数据处理和运算,涉及算术和逻辑操作。存储:关注数据的保存和管理,涉及文件系统和磁盘操作。通信:关注数据在不同设备之间的传输,涉及网络和接口配置。程序:关注如何通过指令集合实现特定功能,涉及进程管理和编译。计算:使用lscpunvidia-smiglxinfo查看CPU和GPU信息,使用tophtopmpstat监控计算资源。存储:使用dfdulsblkfdisk查看磁盘和文件系统信息,使用iostatiotop监控存储I/O。通信:使用ifconfigiproutenetstatss。

2024-08-21 22:18:45 1144

原创 socket 验证字符串是否是有效ip地址

【代码】socket 验证字符串是否是有效ip地址。

2024-08-21 22:07:00 98

原创 MinerU pdf文档解析markdown格式、内容提取

参考:demo在线网址:

2024-08-21 16:10:40 476

原创 JSON, YAML, XML, CSV交互可视化

https://jsoncrack.com/editor

2024-08-21 08:03:59 396

原创 AI在线免费数学工具:Qwen2-Math

https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo

2024-08-21 00:01:36 424

LLM-RAG-WEB 大模型本地知识库召回

https://github.com/lonngxiang/LLM-RAG-WEB

2024-03-01

diffusers-flask-streamlit AIGC文生图代码案例,前端后端代码

参考:https://github.com/lonngxiang/diffusers-flask-streamlit

2024-03-01

unidic-mecab 字符文件unidic-3.1.0下载

mecab unidic下载;参考注意:unidic下载可以离线下载https://cotonoha-dic.s3-ap-northeast-1.amazonaws.com/unidic-3.1.0.zip,下载后解压内容放到/anaconda3/envs/tts/lib/python3.10/site-packages/unidic/dicdir/ 下,也可以在线自动下载 python -m unidic download ———————————————— 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 原文链接:https://blog.csdn.net/weixin_42357472/article/details/136320097

2024-03-01

yolov9 自有数据训练代码参考

参考:https://cnloong.blog.csdn.net/article/details/136345319?spm=1001.2014.3001.5502

2024-03-01

中文语音唤醒模型sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01 (C

具体使用可以参考https://cnloong.blog.csdn.net/article/details/136399563?spm=1001.2014.3001.5502

2024-03-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除