- 博客(940)
- 收藏
- 关注
原创 Ubuntu 安装和使用 Fcitx 中文输入法;截图软件flameshot
在 Ubuntu 上安装和使用 Fcitx 输入法框架是一个常见的选择,特别是对于需要中文输入的用户。
2024-09-21 10:33:45
1474
1
原创 稀疏向量 milvus存储检索RAG使用案例
暂时只能在linux ubuntu或mac上使用,因为windows、centos暂时不支持milvus_lite:https://github.com/milvus-io/milvus/issues/34854。
2024-09-20 15:12:20
500
原创 vllm 部署qwen2.5-7b;opeanai 接口访问、requests接口
参考:https://qwenlm.github.io/zh/blog/qwen2.5/https://huggingface.co/Qwen/Qwen2.5-7B-Instruct下载:vllm部署:流式非流式
2024-09-19 13:26:02
577
原创 qwen2.5 vllm推理;openai function call调用中文离线agents使用
参考:运行:运行调用tools报错,qwen官方说会尽快修复增加 /ai/template.jinja 文件。
2024-09-19 12:46:28
1029
1
原创 免费AI播客生成:notebooklm可以生成播客的两个发言人谈论的内容,从各种来源如研究论文、文章
另外notebooklm他本身也是个rag知识库对话,可以直接聊天框对话。
2024-09-15 10:19:48
220
原创 pytorch qwen2-vl自定义数据全量微调
参考:https://github.com/zhangfaen/finetune-Qwen2-VL/tree/main。运行模型保存在:train_output下。2B显存训练也很高,4090卡训练的。安装特定包,对qwen2vl支持。
2024-09-14 10:29:22
677
原创 cursor AI代码编辑器IDE对接本地模型deepseek
参考:https://www.cursor.com/https://platform.deepseek.com/https://www.cursor.com/下载安装后,注册账号登录即可再高级里选择设置再模型这注册模型:模型名称一定要填正确,url地址填好,最后填上秘钥验证
2024-09-13 09:47:04
2468
原创 claude:prompt新奇使用方法
下面prompt大概定义了4个函数,第一个算是system定义,中间二个是需要他执行的东西,最后一个是入口;另外测试claude使用较好,可以直接调用前端显示,svg图片下载,,deepseek效果一般。参考:https://web.okjike.com/originalPost/66e170618becdf39a1c19761。
2024-09-12 13:45:31
481
原创 Chai-1:药物分子结构预测的新型多模态基础模型
它在各种与药物发现相关的任务中都表现出色,包括蛋白质-配体结构预测和蛋白质多聚体预测。Chai-1可以选择性地使用实验约束来实现更准确的预测,并且无需多序列比对(MSA)也能做出强大的预测。Chai-1在各种折叠任务上都取得了最先进的性能,包括配体姿态预测、蛋白质-蛋白质和抗体-蛋白质复合物预测以及单体蛋白质预测3。Chai-1的架构主要遵循之前的工作,但增加了一些新功能,如使用大型蛋白质语言模型的嵌入特征,以及约束特征(如口袋、接触和对接约束)来捕捉实验数据39。
2024-09-12 11:34:43
321
原创 swift qwen2-vl推理及加载lora使用案例
参考:SWIFT支持300+ LLM和50+ MLLM(多模态大模型)的训练(预训练、微调、对齐)、推理、评测和部署。
2024-09-12 10:07:27
768
原创 github actions CICD简单使用案例
参考:https://developer.aliyun.com/article/1540773https://github.com/ViggoZ/producthunt-daily-hot/blob/main/.github/workflows/generate_markdown.yml目录:.github/workflows/fetch-news.yml actions执行yaml(必须这样的目录结构)fetch-news.py 是python脚本fetch-news.py2、构建
2024-09-08 12:32:01
900
原创 transformers多agents调用使用离线大LLM:MiniCPM3模型
【代码】多agents调用使用离线大LLM:MiniCPM3模型。
2024-09-06 16:32:25
172
原创 MiniCPM3-4B 大模型安装vllm推理使用;transformers function call agent使用案例
参考:https://github.com/OpenBMB/MiniCPM下载模型:环境安装:
2024-09-06 15:34:57
289
原创 flux 文生图大模型 自有数据集 lora微调训练案例
数据集:https://huggingface.co/datasets/quocanh34/itay-hires-lora-dataset-v2。国内https://modelscope.cn/models/ai-modelscope/flux.1-dev/files。模型地址:name_or_path;待支持:https://github.com/kohya-ss/sd-scripts/X-LABS 的https://github.com/XLabs-AI/x-flux。1)首先填写配置文件。
2024-09-04 17:37:05
629
原创 vercel免费在线部署TodoList网页应用
参考:TodoList网页应用:https://blog.csdn.net/weixin_42357472/article/details/140909096。
2024-09-01 21:34:39
309
原创 flux bitsandbytes bnb量化;diffusers 15G显卡加载使用
大概需要13G多,t4卡推理一张图需要3-4分左右时间。huggingface-cli login 登录。对text模块bnb量化。
2024-09-01 17:32:59
398
原创 diffusion 模型gguf量化使用案例,支持CPU运行
参考:https://github.com/leejet/stable-diffusion.cpp模型下载,大小4G左右推理,大概需要2G左右显存
2024-08-31 20:07:51
232
原创 flux 文生图bnb量化模型diffusers使用案例
参考:https://huggingface.co/black-forest-labs/FLUX.1-devhttps://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/1079https://github.com/huggingface/diffusers/issues/9149https://huggingface.co/lllyasviel/flux1-dev-bnb-nf4/tree/main下载单个模型:bit
2024-08-31 10:20:17
1077
原创 Aria2 多线程下载器
Aria2 是一个轻量级的多协议、多来源命令行下载工具。它支持 HTTP/HTTPS、FTP、BitTorrent 和 Metalink 协议。Aria2 可以通过 JSON-RPC 和 XML-RPC 接口进行远程控制。
2024-08-31 09:58:37
1514
原创 vllm 推理qwen gguf模型使用案例;openai接口调用、requests调用
vllm 推理qwen gguf模型使用案例;openai接口调用、requests调用
2024-08-29 11:51:26
167
原创 transformers quantization bitsandbytes实时量化方法使用load_in_4bit,load_in_8bit;量化模型保存及加载使用
参考:https://huggingface.co/docs/transformers/main/en/quantization/bitsandbytes?bnb=8-bithttps://www.atyun.com/57101.htmlhttps://huggingface.co/blog/4bit-transformers-bitsandbytesbitsandbytes错误参考:https://cnloong.blog.csdn.net/article/details/141607933使用q
2024-08-28 17:10:48
283
原创 PEFT qwen2 lora微调模型训练案例
参考:https://github.com/huggingface/peft##文档https://huggingface.co/docs/peft/indexhttps://www.wehelpwin.com/article/4299https://www.ethanzhang.xyz/2024/07/09/%E3%80%90%E4%B8%AA%E4%BA%BA%E5%8D%9A%E5%AE%A2%E3%80%91%E4%BD%BF%E7%94%A8huggingface%E5%9C%A8%E5%8
2024-08-28 09:26:58
831
原创 bitsandbytes使用错误:CUDA Setup failed despite GPU being available
参考:https://huggingface.co/docs/bitsandbytes/main/en/installation报错信息版本:Cuda本身拥有两个API,分别是cuda driver version 和 cuda runtime version。1、nvidia-smi查看的是cuda driver version版本(如图1)
2024-08-27 19:31:32
264
原创 CentOS7配置阿里yum源:Could not retrieve mirrorlist http://mirrorlist.centos.org?arch=x86_64&release=7&rep
参考:https://developer.aliyun.com/article/1366034步骤vim CentOS-SCLo-scl-rh.repo 添加内容EPEL(Extra Packages for Enterprise Linux)是一个由 Fedora 社区维护的仓库,旨在为 Red Hat Enterprise Linux(RHEL)及其衍生版本(如 CentOS 和 Scientific Linux)提供额外的软件包。
2024-08-27 18:06:53
712
1
原创 autogen studio agents可视化编排使用
自定义agent,同时模型记得更换。多agent编排组织实现自定义功能。本文章windows平台测试。支持添加离线vllm模型。2)自定义agent。
2024-08-26 14:32:14
70
原创 pytorch FSDP分布式训练minist案例
它的主要目标是解决在多GPU和多节点环境下训练大型模型的内存效率问题。FSDP通过将模型的参数、梯度和优化器状态分片到多个GPU上,从而允许在有限的内存资源下训练更大的模型。优化器状态分片:优化器的状态也会被分片,每个GPU只维护与其参数分片对应的优化器状态。梯度分片:梯度也会被分片,每个GPU只计算和存储与其参数分片对应的梯度。参数分片:将模型的参数分片到多个GPU上,每个GPU只保存一部分参数。通信优化:通过减少通信量和优化通信模式,提高训练效率。fsdp这份代码训练是在单机多卡,两卡上运行的。
2024-08-26 10:25:53
250
原创 autogen agent使用框架案例调用ollama、vllm模型接口
参考:https://github.com/microsoft/autogenhttps://microsoft.github.io/autogen/docs/topics/non-openai-models/local-vllm安装:pyautogen-0.2.35openai-1.24.01) ollama2)vllm制定一个从哈尔滨去北京旅游5天的计划,我们可以按照以下日程进行规划:请根据个人兴趣和实际情况调整行程, 确保有充足的休息时间,同时关注天气 预报和交通状况,以确保旅行的顺利
2024-08-23 11:20:40
252
原创 AI搜索产品:秘塔、天工、perplexity、felo、360AI搜索、bilin
https://metaso.cn/https://www.tiangong.cn/https://www.perplexity.ai/https://felo.ai/search
2024-08-21 22:56:47
665
原创 计算机四个方面:计算、存储、通信与程序;操作系统
计算:关注数据处理和运算,涉及算术和逻辑操作。存储:关注数据的保存和管理,涉及文件系统和磁盘操作。通信:关注数据在不同设备之间的传输,涉及网络和接口配置。程序:关注如何通过指令集合实现特定功能,涉及进程管理和编译。计算:使用lscpunvidia-smiglxinfo查看CPU和GPU信息,使用tophtopmpstat监控计算资源。存储:使用dfdulsblkfdisk查看磁盘和文件系统信息,使用iostatiotop监控存储I/O。通信:使用ifconfigiproutenetstatss。
2024-08-21 22:18:45
1144
diffusers-flask-streamlit AIGC文生图代码案例,前端后端代码
2024-03-01
unidic-mecab 字符文件unidic-3.1.0下载
2024-03-01
yolov9 自有数据训练代码参考
2024-03-01
中文语音唤醒模型sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01 (C
2024-03-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅