自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(434)
  • 资源 (27)
  • 收藏
  • 关注

原创 升级cuda和驱动

在Linux系统安装CUDA时遇到显卡占用问题,需先关闭占用程序:1)运行CUDA/NVIDIA卸载程序;2)终止docker服务;3)检查并关闭占用/dev/nvidia*的进程。安装时添加--override参数强制运行,成功后重启docker服务。通过分步操作解决了驱动安装中的资源冲突问题。

2025-06-11 20:39:24 6

原创 dify批量上传

【代码】dify批量上传。

2025-05-21 09:25:11 41

原创 【多线程】个人理解

实际上thread1上的代码已经开始运行,脑子里想象主程序调试指针和分thread指针同时开始一步步地执行。可以想象主程序运行指针停止了,直到thread1运行完成,相当于wait for thread stop。join常常在主程序的最后面。

2025-04-30 13:56:15 30

原创 【大模型】梯度累加技术教学理解

原文地址:关心问题:Agentic-RAG 和 Graph-RAG,在医疗个性化方案治疗上准确率、幻觉问题、医疗指南频繁更新问题论文地址:https://arxiv.org/abs/2502.15698。

2025-04-24 10:08:12 47

原创 【大模型】梯度累加技术教学理解

梯度累加(Gradient Accumulation)是一种在深度学习训练中使用的技术,主要用于解决GPU内存不足的问题,同时也能模拟更大的batch size训练效果。梯度累加(Gradient Accumulation)是一种在深度学习训练中使用的技术,主要用于解决GPU内存不足的问题,同时也能模拟更大的batch size训练效果。梯度累加是一种简单但有效的技术,特别在资源受限的情况下,能够帮助训练更大的模型或使用更大的batch size。

2025-04-24 10:06:52 37

原创 【大模型】单选数据集制作举例

制作选择数据集,可以用大模型直接生成相应的格式。

2025-04-20 22:54:34 87

原创 【正则表达式】正则表达式使用总结

表达式.+可以匹配一个或多个任意字符(除了换行符)。表达式\s+可以匹配一个或多个空白字符‌。正则表达式除了匹配普通字符外,还可以匹配特殊字符,这些特殊字符被称为“元字符”。‌限定符‌:用于指定正则表达式中某个组件的出现次数。‌预定义字符类‌:用于匹配特定的字符集合。‌定位符‌:用于描述字符串或单词的边界。|表示逻辑“或”,匹配前面的表达式或后面的表达式。*表示前面的字符可以出现0次或多次。+表示前面的字符可以出现1次或多次。表示前面的字符可以出现0次或1次。\W:任意非单词字符‌12。

2025-04-19 18:48:18 238

原创 【大模型框架】LLAMA-FACTORY使用总结

【代码】【大模型框架】LLAMA-FACTORY使用总结。

2025-04-19 18:31:36 226

原创 【论文阅读】Agent-RAG + GraphRAG 双框架治疗幻觉

关心问题:Agentic-RAG 和 Graph-RAG,在医疗个性化方案治疗上准确率、幻觉问题、医疗指南频繁更新问题。

2025-04-19 00:00:00 171

原创 【论文阅读】Agent-RAG + GraphRAG 双框架治疗幻觉

关心问题:Agentic-RAG 和 Graph-RAG,在医疗个性化方案治疗上准确率、幻觉问题、医疗指南频繁更新问题。

2025-04-19 00:00:00 116

原创 【function call】大模型的hello function call

近期,Qwen 发布了 QwQ-32B - 一个在许多基准测试中性能可与 DeepSeek-R1 相媲美的推理模型。QwQ在推理模型中集成了调用工具的能力,使其能够在使用工具的同时进行批判性思考,并根据反馈调整推理过程。这样的能力使得QwQ能够很好在Agentic System中使用。本文介绍如何通过vLLM和SgLang结合QwQ-32B,搭建OpenAI格式的聊天API,并与外部函数结合来拓展模型的更多功能。QwQ-32B,支持Function Call的推理模型,深度思考Agent的时代来了!

2025-04-16 22:12:51 102

原创 FFMPEG和opencv的编译

/rtsp_viewer即可。src目录下main.cpp。然后下载编译ffmpeg。下载编译opencv。

2025-04-13 00:00:00 148

原创 【bug】OPENCV和FPGA的版本对应关系

sampleYOLOV7MultiInput进行视频推理出现Segmentation fault (core dumped)问题!debian只有这一个opencv版本,所以只能改ffmpeg的版本,那个相关issue他自己编译的opencv其实不是很可取,一个是时间长,再者很容易报错。我是debian的系统,apt-get install opencv-dev只能安装3.2的版本, opencv3.2对应我试的可行的是3.2.18。如果opencv和FPGA的版本不对应,则会出现如下warning。

2025-03-30 15:44:51 181

原创 【docker】docker应用举例

依赖管理:确保 requirements.txt或setup.py 文件中列出的所有依赖都能在不联网的环境中正常工作,一定要保证所有的包都在此,要不然后面很麻烦很麻烦。将 my-python-app.tar 文件通过 U 盘、移动硬盘或其他方式传输到不联网的目标机器。首先,在项目根目录下创建一个 Dockerfile,用于定义 Docker 镜像的构建步骤。# 安装项目依赖(加--no-cache-dir应该能使得打包的镜像小)通过以上步骤,你可以在不联网的机器上成功部署 Python 项目。

2025-03-30 15:33:59 124

原创 【智能体】 react functioncall

ReAct 技术与 Function Call 技术介绍 1. ReAct 技术 ReAct 是一种用于增强语言模型推理能力的技术,通过在模型的推理过程中引入“思考”(thought)步骤,帮助模型更好地理解和规划下一步行动。核心思想: ReAct 在传统的“行动-观察”(action-obser。AI - ReAct 技术与 Function Call 技术介绍 - frank_cui - 博客园。

2025-03-30 15:30:56 166

原创 【运维】负载均衡

开头先理解一下所谓的“均衡”,不能狭义地理解为分配给所有实际服务器一样多的工作量,因为多台服务器的承载能力各不相同,这可能体现在硬件配置、网络带宽的差异,也可能因为某台服务器身兼多职,我们所说的“均衡”,也就是希望所有服务器都不要过载,并且能够最大程序地发挥作用。老规矩,先占坑,后续更新。

2025-03-30 15:24:12 442

原创 【大模型应用】信息抽取的调研

老规矩,先占坑,后续更新。

2025-03-30 15:14:23 44

原创 【RAG】核心概念

某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这些指标分别如下:准确率=700/(1400+300+300)=35%精确率=700/(700+200+100)=70%召回率=700/1400=50%分母不同链接:https://zhuanlan.zhihu.com/p/146711298。

2025-03-11 10:14:22 40

原创 [RAG] 基本概念

某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。bm25 BM25的核心思想是基于词频(TF)和逆文档频率(IDF)来,同时还引入了文档的长度信息来计算文档D和查询Q之间的相关性。首先通过embedding模型,将query向量化,然后计算得出最近的数值最高的几个。准确率=700/(1400+300+300)=35%精确率=700/(700+200+100)=70%召回率=700/1400=50%# 召回率 精确率 准确率。

2025-03-11 10:13:10 59

原创 【大模型训练】Qwen2.5-7b的训练记录

可以看到把原来的你是谁都给训练坏了,但是我们不关心这个,我们训练的是数学方面的,只关心数学。可以用四个80G的A800 gpu全参跑起来。可以看到已经可以有thinking过程了。的第一个训练案例,看看有没有学到。可以看到没有反思过程,且结果错误。

2025-02-24 09:25:46 111

原创 【oneapi】oneapi做代理

这样外部就可以通过访问DeepSeek-R1来访问deepseek-ai/DeepSeek-R1。模型填 deepseek-ai/DeepSeek-R1和DeepSeek-R1。base url 填 https://api.siliconflow.cn。名称填DeepSeek-R1。分组填default。

2025-02-19 13:59:31 171

原创 【大模型训练】 用LLAMA_FACTORY复现deepseek-r1的蒸馏过程

2. 从链接https://huggingface.co/datasets/open-r1/OpenR1-Math-220k/则可以从本机的服务器中根据ip直接访问 http://192.168.100.100(服务器地址):11111(开放端口)中下载parquet文件全部放到OpenR1-Math-220k文件夹中。1. data文件中新建OpenR1-Math-220k文件夹。dataset_info.json中新增。4. 启动LLAMA_FACTORY。如果11111是开放的端口,

2025-02-13 17:06:43 592

原创 【docker】docker改动镜像并重新编译举例

FROME: Docker 默认会尝试从远程仓库拉取镜像,如果本地镜像名称和标签与 FROM 指令完全匹配,Docker 会优先使用本地镜像。参考: https://github.com/vllm-project/vllm/issues/12980。会发现本地有vllm/vllm-openai:v0.7.2镜像,id为f78c8f2f8ad5。发现有了新的被改动过的镜像vllm-qwen2.5-vl-pip-transformer。可以将本地的镜像保存到本地tar包。若不放心把images。

2025-02-11 21:45:19 259

原创 【go】交叉编译

复制了一份项目代码task为task_bk,但是原来的task删除了,再次。把task_bk变成task出现这种情况,可以看出可以正常编译出文件,file->settings->GOPATH->设置为当前的项目目录。Goland中导入包标红但是能用解决办法。发现go像是c++,做后台还是比较好的。

2025-02-10 14:31:19 243

原创 【python】使用re替换和查找字符串

替换可用replace,这里统一用re。

2024-12-16 20:31:40 196

原创 【linux】命令记录

tail -f train.log 可以结合nohup sh train.sh &使用。

2024-12-11 22:15:26 72

原创 【python基础】包

import math(此处math其实是文件,省略了.py扩展名)import 路径.文件名。

2024-12-11 22:06:27 70

原创 【文件操作】写入json文件

dump是导出的意思,这样看dict和list是自己人,但是string和文件相对于代码就是外人。一般用json.dumps把dict或者list导出到字符串。一般用json.dump把dict或者list导出到文件。

2024-12-11 22:02:49 164

原创 【大模型微调】reft

因工作重点做LLM的落地,对模型的 Reasoning 推理能力要求较高,也实践过 CoT 微调。而 o1 能推出 RFT 证明这项技术已经生产可用,故接下来就认真研究下业界方案,尤其关注可落地执行的开源方案。首个拜读的论文是来自字节的 《ReFT: Reasoning with Reinforced Fine-...OpenAI o1 强化微调(RFT)开源方案之字节 ReFT - 腾讯云开发者社区-腾讯云。一个是微调,第二个是PPO强化微调。reft是字节跳动首次开发(占坑,后续开发)

2024-12-11 21:50:44 111

原创 【opencompass】使用记录

先记录,后面用的时候再说。

2024-12-11 21:45:46 127

原创 【正则表达式】提取大文章的每一个小节

需要背诵一些正则表达式的知识。+ 是连续1个或多个。* 是连续0个或多个。

2024-12-11 21:41:03 430

原创 【大模型微调】图片转pdf

vd_source=8318f88fcdf4948d2b21fae7c9cf3184 2024最新!用上面的方法如果对于过长的图片,则一页的长度也很长,上面的解决方案都有问题,最终自己还是用代码解决。https://www.32r.com/zt/dgyjzzrj/ photoshop破解版下载。用acobot保存图片们为pdf即可。有时候图片需要转成pdf。1. 用代码将长图片切割。

2024-12-03 21:47:50 448

原创 【大模型微调】pdf转markdown

启用MathJax支持后,您应该能够在Typora中正确显示使用LaTeX语法编写的数学公式,包括$\mathbf{X}$这样的符号。注意上面的cuda,rapid_table部分, max_time设置长一些,要不然保存的表格都是图片。生成markdown后可以用大模型过滤一遍后者人工过滤一遍,改正后者去除不合适的部分。目前市面上大部分都是pdf文档,要想转换成能训练的文本,调研了各种工具。目前无法显示typora无法显示html的表格,后续看看怎么弄。最终生成的表格是html格式的,可以在。

2024-12-03 21:39:55 450

原创 【大模型微调】LammaFactory使用的一些经验

可以设置启动的端口。

2024-12-02 20:39:22 174

原创 【RLHF】Reward Modeling

RLHF:基于人类反馈的强化学习(Rainforcement Learning from Human Feedback,RLHF) 可以分成两个环节。,它们的细节我们不去研究,只要知道DPO主要用于分布式训练,适合大规模并行处理的场景,PPO通常指的是单机上的算法就可以了。在这一阶段,模型学习和输出的内容发生了根本性的改变。前面的两个阶段,预训练和微调,模型的输出是符合预期的文本内容;这个阶段输出的评分,并不是给最终的用户,而是在强化学习阶段发挥重大作用。常见的强化学习策略包括。

2024-12-01 10:17:14 133

原创 【LLAMA FACTORY】 freeze模式总结

训练模式有full, lora(+ qlora),和freeze模式,感觉freeze模式很少被提及,这里做一个总结。Freeze(冻结微调)指的是在训练过程中只对模型的小部分权重进行更新,这样可以降低对显存的要求。如果您需要进行冻结微调,请将。

2024-12-01 10:11:24 553

原创 【大模型微调】一些观点的总结和记录

对于垂类模型,更应该关注PT的过程,而不是采集千万百万的SFT数据做训练,一般建议是 大规模预训练+小规模监督微调=超强的LLM模型。原来的风格是列表回复,如果sft数据集很短,则sft后的数据集也会很短,理论上二者的风格应该一致才行。sft微调的越多,遗忘的越多. 不过对于小任务,rank比较低(例如8,16)的任务,影响还是有有限的。,为了保证模型语言能力关键区不被大幅度调整,需要添加通用指令微调数据或者预训练数据。微调方法没有大变数了,只能在数据上下功夫,我能想到的只有提高微调数据质量。

2024-11-30 21:42:46 138

原创 【程序员超级记忆法】关于记忆方法论在代码写作中的一些思考

有本关于敏捷开发方面的书非常不错《高效程序员的45个习惯-敏捷开发修炼之道》,Venkat Subramaniam和Andy Hunt著,该书简短、易读、精炼、深入,深刻且实用。2. dump是转存,倾倒的意思,看来string是被抛弃的外部对象(不当string是python的自家人),只有list或者dict是自己人。1. 无论是dumps或者是loads,都有一个s,是string的缩写,本质两个api是对string和list或者dict的类型转换。不带s的是将文件中的内容转成dict或list。

2024-11-30 11:00:26 79

原创 【医疗大模型】总结

基于主动健康的主动性、预防性、精确性、个性化、共建共享、自律性六大特征,华南理工大学未来技术学院-广东省数字孪生人重点实验室开源了中文领域生活空间主动健康大模型基座ProactiveHealthGPT。我们期望,生活空间主动健康大模型基座ProactiveHealthGPT 可以帮助学术界加速大模型在慢性病、心理咨询等主动健康领域的研究与应用。本项目为 生活空间健康大模型扁鹊(BianQue)。医疗AI与GPT | 梳理全球医疗大模型。

2024-11-22 09:09:07 68

原创 【大模型】prompt实践总结

不同的prompt对不同的模型有不同的效果。编写高质量Prompt的技巧包括以下几个方面‌:‌明确“好结果”的标准‌:在大多数情况下,Prompt的性能上限与我们对“好结果”的理解程度成正比。只有充分理解了所谓的“好结果”具体好在哪些“点”,才能将这些“点”形式化为Prompt,从而更准确地传达意图。例如,明确要求从画风和剧情两个角度入手,为《长安三万里》写影评,而不是仅仅要求写影评‌1。编写明确而具体的指示‌:使用“少量示例”(Few-shot)提示法,提供一些示例让模型更好地按照预期执行任务。

2024-11-14 21:05:36 774

【医疗人工智能】基于NCCN指南的乳腺癌个性化治疗计划:Agentic-RAG与Graph-RAG方法性能对比及临床应用评估AI驱动的方法

内容概要:本文介绍了一种基于NCCN(国家综合癌症网络)指南的人工智能工具,用于为乳腺癌患者提供个性化治疗方案。研究提出了两种AI驱动的方法:Agentic-RAG(检索增强生成)和Graph-RAG。Agentic-RAG通过三个步骤选择临床标题、检索匹配的JSON内容并迭代优化推荐,确保治疗建议的准确性。Graph-RAG则将JSON数据转换为文本并通过大型语言模型(LLM)进行总结,再映射成图结构表示关键治疗关系,最终生成推荐。实验结果显示,Agentic-RAG实现了100%的指南依从率,无幻觉或错误治疗;Graph-RAG达到95.8%的依从率,仅有一例错误治疗。两者均提供了详细的治疗建议,并引用了具体的NCCN文档页码。; 适合人群:从事肿瘤学研究和临床工作的医生、研究人员以及对AI在医疗领域应用感兴趣的科技工作者。; 使用场景及目标:①帮助医生快速获取符合NCCN指南的个性化乳腺癌治疗方案;②提高医生对复杂治疗指南的理解和应用效率;③支持临床决策,确保治疗方案的准确性和透明度。; 其他说明:研究强调了Agentic-RAG和Graph-RAG在处理复杂医学指南方面的优势,特别是在提供详细、可追溯的治疗建议方面。未来的工作将扩展测试范围,涵盖更多类型的癌症,并评估系统在实际临床环境中的表现。此外,系统与电子健康记录(EHR)的集成将进一步提升其临床应用价值。

2025-04-21

考研高数免费复习全书 可用于自己研究

考研高数免费复习全书 可用于自己研究

2024-11-10

dropout相关的论文合集

dropout相关的论文合集

2024-11-10

神经网络模型压缩方法讲解二值三值DNS\INQ等

模型压缩ppt的总结,可以作为粗略的一个概述,很精炼。

2018-04-17

ICCV2019.pdf

It is challenging for weakly supervised object detection network to precisely predict the positions of the objects, since there are no instance-level category annotations. Most existing methods tend to solve this problem by using a two-phase learning procedure, i.e., multiple instance learning detector followed by a fully supervised learning detector with bounding-box regression. 更多内容加微信 ai_seer

2020-05-29

实用新型专利表格.rar

实用新型专利表格.rar

2024-07-30

notepad++安装包

notepad++安装包

2024-06-16

qt开发office文档编辑器思路

跟网上的一个qt网课班的老师要的,估计不咋样

2023-06-11

poly-yolo.pdf

与YOLOv3相比,训练参数只有60%,但MAP提高了60%,并提出更轻量版的Poly-YOLO Lite,与YOLOv3比有相同的京都的,但是更小更快,可应用到实力分割上,代码和论文刚开源!

2020-05-29

jbox2d内含jar包,在dist下

jbox2d内含jar包,在dist下,或者其他目录

2023-01-15

神经网络最经典书籍

很早之前的书籍,但是包含了卷积神经网络、网络剪枝等现在都很时髦的技术。非常惊艳,实在是神经网络必读书籍。

2018-05-24

mnist数据集为keras

keras的一个mnist例子,相当于学习keras的hello,world程序,具体代码见博客https://blog.csdn.net/andeyeluguo/article/details/80565012

2018-06-04

aflw的标注

aflw的标签数据,自己做的,带程序

2017-06-07

图像描述标注工具

用一句话标注一句话的工具及其代码

2017-06-30

弱监督目标检测论文.rar

今天有群友反馈弱监督目标检测论文少,收集了部分最新的 cap2det谷歌结合文字信息进行弱监督检测.pdf ICCV2019一篇 instance-aware弱监督目标检测CVPR2020 清华大学弱监督2019 商汤AAAI2020 中科院利用弱监督目标检测中的不稳定性 抛砖引玉,没有积分直接添加微信seer_ai发送 更多内容加微信免费获取

2020-05-29

一个群聊聊天室代码

能够完全运行的,具有客户端和服务端代码

2017-07-12

类似于陌路人人的聊天源码

请在wamp下运行,首先修改common.php中的服务器密码,然后按照说明即可。 可以在同一机器上不同浏览器打开窗口实验.这个是我目前见过最好的代码。只是不能发表情和图片。

2017-07-28

物体检测论文集

包括rcnn,fast-rcnn faster-rcnn,mask-rcnn,yolov1-v3,ssd,fcn等

2018-04-28

vivado2018-1的license文件

vivado2018-1的license文件,具体可以参照博客。https://blog.csdn.net/andeyeluguo/article/details/80656965

2018-06-11

dorefa-net

包含难下载安装的tensorflow镜像和tensorpack,具体参照博客,https://blog.csdn.net/andeyeluguo/article/details/80986553

2018-07-10

light-head论文

论文,包括retinanet ,light-head rcnn yolo9000,yolov2四篇目标检测论文

2018-09-10

中科院利用弱监督目标检测中的不稳定性.pdf

Weakly supervised object detection (WSOD) focuses on training object detector with only image-level annotations, and is challenging due to the gap between the supervision and the objective. 更多内容添加微信 seer_ai

2020-05-29

vs社区版在线安装

在线安装vs2017,vs社区版在线安装。无激活码,可直接使用

2018-06-11

oCam_v475.0.exe

这是我用过的最好的录屏软件,完全免费,可以录声音和屏幕,做微课。

2019-10-13

原始MIT人脸库

原始MIT人脸库,其中包括人脸20*20的bmp格式2706幅图,以及非人脸20*20的bmp格式4381幅图-original MIT face database, including face folder and nonface folder

2015-08-13

FERET人脸数据库

FERET人脸数据库,80*80大小,200张人脸,每人7幅图片-feret face database,80*80

2015-08-13

收集的专乎的一些代码

可以参考一下,具体例子自www.zhuanzhi.ai/,搜索pytorch,自动化所的一个博士写的

2017-10-10

单词30万,适合自然处理和其他功能

30万单词

2017-04-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除