- 博客(219)
- 资源 (4)
- 收藏
- 关注
原创 Logon failed, use ctrl+c to cancel basic credential prompt
克隆别人私库代码(已经开了权限)报错如标题,豆包查了下Git命令行禁止用密码,必须用Token(PAT)或SSH密钥。
2026-05-21 15:37:19
30
原创 MinerU学习
MinerU 专注于高效解析和提取复杂的 PDF 文档、网页和电子书,并将其转换为易于分析的 Markdown 或JSON 格式。由 上海人工智能实验室OpenDataLab 团队 开发。主要功能包括:• PDF 转 Markdown支持多模态 PDF(含图片、表格、公式等)的结构化转换。自动去除页眉、页脚、脚注等干扰信息,保留标题、段落、列表等结构。公式识别并转换为 LaTeX 格式,表格转换为 HTML 或 Markdown。
2026-05-15 17:39:13
380
原创 多模态处理-图像学习
LLM多模态处理图像 OCR的区别,llm能理解整张图的语义、逻辑、场景关系;ocr只是单纯的提取文字,不懂语义。列举几个多模态模型,比如:glm-5.1、Qwen3.5-plus、kimi-k2.6。本文示例,使用的qwen3.5-plus。
2026-05-14 16:27:02
50
原创 Coze智能体记忆变量、长期记忆、文件盒子
coze搭建智能体时,记忆模块有变量、数据库、长期记忆、文件盒子,他们分别什么用,什么时候用?单次对话内,临时存储用户关键信息,对话结束或重新开对话,变量内容清空如果不使用变量,多轮对话后就记不住,之前的信息了。比如:搭建旅游智能体,第一次输入:上海,1日,2人,1000元规划中间多轮对话,比如:再加1个人,或其他问题最后问,我的预算是多少,大模型就记不住了。但是如果新建变量,单次无论多少轮对话,变量永远固定保存关键信息,相当于智能体记住关键信息,比如预算。
2026-05-13 23:20:03
248
原创 python通过API调用Coze智能体学习
可以自己写个程序、网页、微信小程序、app调用这个智能体,智能体作为我们程序的一部分。发布会有个链接,这个链接可以发给其他人,这样其他人就能是有这个智能体了。需要获取智能体id、API_KEY。2、选择个人令牌,点击添加。3.4、程序demo代码。
2026-05-11 23:13:35
694
2
原创 模型微调学习
类比:手把手背标准答案核心:用(问题->标准优质回答)成对数据,让模型模仿句式、格式、知识话术特点:只学[什么是正确回答],不学[哪个回答更好],是所有微调的基础。例子:训练电商客服机器人时,我们可以提供大量这样的数据:输入:"我要退货,怎么操作?输出:"亲,退货流程如下:1)进入订单详情页;2)点击申请退货;3)选择退货原因;4)提交后等待审核..."模型学习的是:当用户问退货相关问题时,应该按照这个固定格式和步骤回答。重点是答案必须准确、格式规范,不能教错知识。
2026-05-11 17:33:15
276
原创 CreateFileW长路径问题
项目前场反馈某个功能有问题,排查发现调用CreateFileW(系统API),失败了,lasterror是3(系统找不到指定的路径)。
2026-05-08 15:24:25
203
原创 AI开发框架相关问题整理
能力继承:这是最神奇的地方。会生成 {"name":"get_weather","description":"...","parameters":{"city":{"type":"string"}}}LLM分析用户问题判断是否需要调用工具,若需要,则根据收到的JSON Schema,生成结构化的工具调用指令(如get_weather("北京");2、Action(行动):根据推理结果,选择对应的工具并生成调用指令(含工具名称和参数),比如:get_weather("北京")
2026-05-06 16:07:39
241
原创 LangChain Qwen对比学习
主流AI Agent框架有哪些?LangChain:国外的,全能型框架,支持RAG、Agent、工具调用、记忆、多轮对话、流程编排全覆盖Qwen-Agent:国内的,主打轻量化智能 Agent 快速落地,适配中文场景,封装简单、学习成本低,更适合国内模型LlamalIndex:主要偏向数据处理,比如:RAG。
2026-04-27 15:21:47
289
原创 LangChain学习
除了预置工具,还可以用 @tool 装饰器创建自定义工具,把普通函数变成AI能用的工具Agent自动判断什么时候用,用哪个工具示例代码:实现了 AI 智能体 + 自定义加减乘工具,让 AI 能自动调用你写的函数完成计算任务。
2026-04-23 15:25:59
463
原创 Agent相关问题整理学习
关键指标之一是自定义的ProcessingMode评估器:比如用户问 “查余额” 这种简单问题,如果 Agent 调用了复杂的 Planner 链路,而非直接走 API 查询,即使答案正确,在测试中也会判定为失败,因为这浪费了 Token 和时间,影响系统整体效率。设计了一个while循环,当Code Interpreter 返回 Error时,不直接把错误抛给用户,而是把错误信息 + 之前的代码重新喂给LLM,提示它,这段代码报错了,
2026-04-21 14:06:33
347
原创 playwright学习
微软开发,基于Devtools协议的浏览器自动化工具,支持浏览器Chrome、Edge、Firefox、WebKit(Safari 内核)。支持多种语言,Node.js、TypeScript/JavaScript、Python、.NET、Java。官网:https://playwright.dev/
2026-04-16 17:52:31
329
原创 Elasticsearch使用学习
Elasticsearch 可以理解为一个擅长检索和分析的分布式文档数据库,同时也是一款开源、高可扩展的分布式全文检索引擎,完全开源免费,非常适合海量文本数据的快速存储与检索。由于 ES 基于 Java 开发,传统安装需要预先配置 JDK 1.8 及以上环境。不过从 Elasticsearch 7.0 开始,安装包已内置适配的 OpenJDK,无需再单独安装和配置 Java 环境,部署更加简便。官网:https://www.elastic.co/cn/downloads/elasticsearch。
2026-04-09 13:44:35
277
原创 Qwen-Agent 内置RAG学习
Qwen-Agent的内置rag系统,默认基于BM25 关键词检索算法实现文档匹配,是轻量级内存式RAG,Assistant 传入files参数即激活内置 RAG,适合小批量文件处理。【内存加载流程】1、文档解析与分块doc_parser(qwen_agent\tools\simple_doc_parser.py)按文件后缀pdf、txt、docx等解析文件,按默认500字符将文本切分成多个文本块,生成{page_content, metadata}的字典列表2、内存存储。
2026-04-08 17:05:18
72
原创 LangSmith学习
LangSmith 是 LangChain 官方推出的 LLM 应用全生命周期开发平台,核心定位是为基于 LangChain/LangGraph 构建的大模型应用提供端到端的可观测性、调试、测试与评估能力,解决 LLM 应用开发中「黑盒难调试、性能难监控、效果难评估」的核心痛点。
2026-04-03 13:17:19
376
原创 Base64学习
2、后端把图片信息base64数据嵌入到API响应中,前端负责显示。1、邮件的附件,附件内容原始文件是base64编码。为了把二进制内容安全转成文本字符串。为什么会有base64呢?
2026-04-02 15:11:58
62
原创 MCP学习
FastMCP 是 Python MCP SDK 中的轻量级服务器框架,特点如下:自定义MCP server安装依赖:# 1. 初始化FastMCP服务(仅1行)# 2. 注册工具:文本统计(自动发现,无需额外配置)"""统计文本的字符数、行数、单词数:param text: 需要统计的文本内容:return: 结构化统计结果"""return (f"文本统计结果:\n"f"总字符数(含空格/标点):{char_count}\n"f"总行数:{line_count}\n"
2026-04-01 09:33:18
380
原创 Function Call学习
1、使用 @register_tool(工具名) 注册工具2、定义类继承BaseTool,自定义工具类必须继承这个基类,基类提供了call方法规范、参数解析、异常捕获能力3、description定义工具的描述,这是给大模型看的说明书,模型根据描述判断什么时候调用这个工具4、def call 是模型真正调用的函数,工具的执行入口,params模型传过来的参数(字典或json字符串),返回值必须是str。
2026-03-31 11:15:58
224
原创 RAG相关问题整理学习
向量检索是语义匹配,BM25是关键词匹配向量检索缺点:可能匹配不准1、对精确关键词匹配不敏感 (如产品型号、人名)比如产品型号、人名、编号、术语,只看语义相似度,不看字面是否完全一致。2、容易匹配不准,甚至漏掉字面完全匹配的内容语义相似但实际不是同一个东西,也会被召回混合检索 = 向量检索 + BM25匹配,结合向量检索和关键词匹配相结合。【示例】缺点 1:对精确关键词、编号、型号不敏感例子:文档里有:“苹果 15 Pro 电池容量 4400mAh”
2026-03-25 15:13:16
364
原创 用户帐户限制(例如,时间限制)会阻止你登录。请与系统管理员或技术支持联系以获取帮助。
核心原因是被远程的计算机账户密码为空,且系统安全策略默认禁止空密码账户进行远程登录。
2026-03-23 14:58:42
199
原创 RAG系统-高效召回学习
Vector (向量/语义检索, 如FAISS): 能够理解词语间的语义关系,即使查询词与文档用词不同,也能找到意思相近的内容。通过大模型将用户原始问题改写为多个语义等价、视角不同的查询,分别检索后合并结果,解决单一查询漏召回、用户表述不规范的问题。这个方案思路相当于用混合检索,比如检索了30个,再用Rerank模型精细匹配,提高召回精度。混合检索要快一些,rerank检索要慢一些,所以要先混合检索 再rerank检索。融合 BM25(关键词)和 FAISS 向量检索(语义),平衡召回率和精准度。
2026-03-20 11:02:37
466
原创 RAG系统知识库本身的能力建设学习
上海迪士尼乐园位于上海市浦东新区,是中国大陆首座迪士尼主题乐园,于2016年6月16日开园。乐园占地面积390公顷,包含七大主题园区:米奇大街、奇想花园、探险岛、宝藏湾、明日世界、梦幻世界和迪士尼小镇。解决思路:用AI为每个知识切片生成多样化的问题,通过用户提问与原文、生成的问题匹配,俩种检索方式,提高检索的准确率。(类型: 条件问, 难度: 中等)4. 与全球其他迪士尼乐园相比,上海迪士尼乐园有什么特别之处?(类型: 对比问, 难度: 中等)(类型: 间接问, 难度: 中等)
2026-03-20 10:39:54
53
原创 判断一个文件最后修改时间是否超出了指定天数
【应用场景】缓存管理: 用于验证缓存文件是否过期,决定是直接使用还是重新生成。数据备份: 用于识别新增或修改过的文件,以便执行增量备份。清理临时文件: 用于自动删除系统中超过保留期限的无用临时文件或日志。监控与告警: 用于检测关键文件是否长时间未更新,以判断服务或流程是否异常。任务调度: 用于确保下一个任务仅在必要的输入数据足够新时才被执行。软件授权: 用于检查授权文件的时效性,以验证许可证或试用期是否有效。
2026-03-17 16:33:37
30
原创 NoteBookLM学习
NotebookLM 是 Google推出的基于Gemini 模型的私人多模态知识库AI助手。网址:https://notebooklm.google.com/需要正确上网!!!!1、每个Notebook最多50个文件,每个文件最多包含50万字或200兆字节的数据。用户可以上传多达2500万字的文本来创建特定学习主题的笔记本。2、NotebookLM可以组织信息、总结关键事实,回答用户的问题,并制作成播客。
2026-03-17 11:27:00
733
原创 基于Windows消息跨进程读取 TreeView 节点文本和矩形
代码基于windows消息TVM_HITTEST、TVM_GETITEMW、TVM_GETITEMRECT等跨进程读取TreeView节点文本和矩形。代码属于demo功能验证级别,可以跑通,主要实现如下功能:1、跨进程通过屏幕坐标定位 TreeView 控件指定节点;2、获取指定 TreeView 节点的文本内容;3、获取节点整体矩形区域及仅文本部分的矩形区域(含相对 / 屏幕坐标转换);4、遍历 TreeView 根节点下一级子节点,批量提取节点文本与矩形信息。
2026-03-13 17:26:47
43
原创 RAG学习、RAG问答demo搭建
收集并整理文档(pdf、doc、xlsx、txt等)、网页、数据库等数据,去除乱码、多余空格,统一编码、格式、标点、无效信息,确保数据完整性。1、大模型是有窗口大小限制的,比如:不能把几万、几十万页的文档及用户问题塞给LLM,必须通过检索出相关信息,再进行输入。2、知识是私有的,比如:公司的内部文档、业务数据,大模型是不知道的,此时可以做成一个RAG知识库,配合大模型使用。3、时效性问题,比如:大模型训练的数据是静态的,无法涵盖最新消息,RAG可以检索最新外部数据。
2026-03-11 17:18:22
358
原创 向量数据库FAISS学习
存储和查询向量的数据库,向量可以从文本、图片、音视频转化而来,核心能力是高效的相似性检索。向量数据库的价值1、为大模型提供长期记忆:弥补LLM上下文窗口长度限制和、解决知识过时问题。用户提问时,先去向量库搜索相关内容,把搜索到的内容和用户问题一起塞给大模型,模型回答用户问题。2、私有知识库问答、语义搜索:将企业内部文档、产品信息等转化为向量,实现基于语义的智能检索3、推荐系统、以图搜图等场景用向量相似度做召回、排序和传统数据库的区别:不精确匹配,找最像的。
2026-02-28 17:23:43
441
原创 word Embedding、Word2Vec学习
word Embedding 将自然语言单个词向量化,转换完向量可以进行计算了(比如:相似度计算)。word2vec是一个简化版的embedding训练工具,训练时语料越多、质量越高,训练后的模型越准确。百炼平台、魔搭平台上有预训练好的embedding模型,可以直接使用,不用自己从头训练,图片和文字的embedding模型是不同的,意味着你不能用文字的embedding模型去处理图片。embedding模型和LLM是完全不一样的,
2026-02-28 10:55:10
1154
原创 teamtalk登录用户名、密码写配置文件学习
在teamtalk登录界面中,当用户点击"登录"按钮时,系统将执行一系列操作,其中包括一个写配置文件的动作。此动作负责将用户在界面上输入或选择的信息保存到配置文件中(用户名、密码、记住密码勾选状态,服务器ip地址等信息)。这个配置文件的作用:程序下次启动时,能够自动从配置文件中读取并加载之前保存的信息,提升用户体验。登录按钮对应的代码如下,其中写配置文件的代码是。
2026-02-27 16:56:56
910
原创 YOLO学习
YOLO可以从给定的图片中找物体(比如:人、车、猫),用矩形框和类别标签,标出所有被识别出的物体,主流的YOLO代码实现是基于PyTorch框架编写的。最新版本YOLOv12,https://github.com/sunsmarterjie/yolov12。
2026-02-24 14:22:41
1010
原创 TensorFlow学习
谷歌开发的开源机器学习框架,高效、便捷地实现神经网络。TensorFlow把前向传播、反向传播、参数更新这些复杂容易出错的底层步骤全部封装起来了,只需调用简洁的API,就能完成模型的搭建和训练。
2026-02-12 10:04:46
780
1
Dependencies在win10下查看exe、dll依赖文件
2026-04-09
C++ 使用 ActiveX 控件构建 Windows RDP 客户端
2026-03-31
glog-v0.7.0 改造:统一日志文件 + 自定义文件名 + 新增时间滚动规则
2026-03-20
resource-hacker
2025-12-02
使用zlib静态库封装压缩、解压缩接口(C++源码)
2025-10-27
实现窗口全屏、退出全屏的demo
2025-10-27
nginx的windows编译,用vs2017编译nginx,带vs工程配置文件,可直接调试 有想学习nginx源码或http相关流程,可下载在windows上用vs调试学习学习
2025-07-26
使用Windows API和WTL技术,实现在屏幕上创建透明的、置顶的、鼠标穿透的窗口,并在该窗口上绘制一个中空矩形(源码)
2025-07-23
breakpad源码(有windows工程配置文件,可以直接用vs2010打开编译)
2018-05-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅