星期天要睡觉-CSDN博客

原创提示词（Prompt）——链式思维提示词（Chain-of-Thought Prompting）在大模型中的调用（以 Qwen 模型为例）

链式思维提示词是**提示工程（Prompt Engineering）**中最实用、最有效的逻辑强化技巧之一。它能让模型“像人一样思考”，在推理、分析、解释性任务中显著提高准确率。不要直接问模型答案，要教它“先想清楚，再回答”。通过在提示中添加一句：让我们来分步思考。你就能显著提升模型的逻辑推理能力与可靠性。

2025-10-28 21:31:22 1101

原创提示词（Prompt）——指令型提示词在大模型中的调用（以 Qwen 模型为例）

指令型提示词让模型从“对话式助手”变成“任务执行者”。结合合理的参数控制、结构化输出与明确约束，可以实现：精准可控的生成结果；结构化数据接口；高鲁棒性与可复现性。未来的提示工程趋势，也正在从“写一句话”走向“编写指令集”。当提示词具备了程序化逻辑，模型调用就不仅是“问答”，而是“任务执行”。指令型提示词的核心，是把自然语言变成机器可执行的“微命令”。当提示足够明确，模型就能像程序一样精准执行。

2025-10-28 21:27:03 1132

原创 BERT 原理解析：从 Transformer 到双向语义理解

词向量模型（Word2Vec、GloVe）—— 静态词向量；RNN / LSTM 模型—— 处理顺序信息但计算慢；单向语言模型（GPT、ELMo）—— 只能理解部分上下文。而的诞生改变了一切：它首次让模型能在大规模语料上双向理解上下文语义，并通过预训练 + 微调（Pre-train & Fine-tune）机制通吃各类 NLP 任务。BERT 的革命性意义首次实现了双向语义建模；创造了“预训练 + 微调”范式；极大推动了 NLP 的工业落地；成为后续所有大模型（GPT、ChatGPT）的奠基。

2025-10-27 21:48:44 1849

原创什么是提示词（Prompt），提示词类型、结构解析

在与大语言模型（LLM, Large Language Model）交互时，我们给模型的文字输入就叫做提示词（Prompt）。Prompt 不仅仅是“输入一句话”，而是一种引导模型思维的工程技术。它的作用是告诉模型：你是谁（角色）你要干什么（任务）你要怎么干（步骤）你要输出成什么样（格式）提示词不是简单的输入，而是一种思维设计。优秀的提示词能让同一个模型表现出完全不同的能力。当我们理解提示的层级、类型与策略，就能让AI真正成为高效的“思维伙伴”。

2025-10-26 23:44:48 2008

原创 RAG：让大模型“既懂又查”的智能系统

要点内容RAG 核心目标把外部知识引入生成流程关键组成检索 + 向量数据库 + 大模型生成典型框架优势实时知识、低成本、强扩展性未来趋势Graph-RAG、Agent-RAG、自适应检索。

2025-10-23 23:39:17 823

原创 LangChain：让大模型具备思考与行动能力的框架

✅ 优点：快速构建复杂的多步推理应用模块化、扩展性强支持主流大模型（OpenAI、Qwen、Claude、Gemini 等）自带 Memory、Tools、RAG、Agents 等高级能力⚠️ 缺点：框架抽象层多，调试相对繁琐对初学者来说理解 prompt 流程和 agent 执行机制有一定门槛。

2025-10-23 23:36:21 1120

原创深度学习——基于 PyTorch 的蔬菜图像分类

1. 配置参数ROOT_DIR = 'vegetables_cls' # 修改为你的实际路径'bocai','huluobo','xilanhua'项目根目录│每个.txt文件存储图像路径及其标签，例如：ROOT_DIR：数据根目录，包含训练、验证、测试图像。：共 6 种蔬菜类别。DEVICE：自动检测是否可用 GPU 加速。通过CLASSES数组定义类别名。# 2. 自定义 Dataset# 读取 txt 文件。

2025-10-22 21:55:03 1150

原创自然语言处理（NLP）——自然语言处理原理、发展历程、核心技术

自然语言处理（Natural Language Processing, NLP）是人工智能的重要分支，旨在让计算机能够。简单来说，NLP 是“让机器读懂人话”的技术。语言是人类最复杂的符号系统之一，包含语音、文字、语义、情感、上下文等多维信息。NLP 通过计算机算法，将这些语言特征转化为机器可理解的数字信号与结构化表示。举例：输入一句话：“我今天心情很好。机器需要识别出：主语：“我”时间：“今天”情绪倾向：正向句子类型：陈述句。

2025-10-21 22:08:46 1280

原创大模型（Large Language Model, LLM）——什么是大模型，大模型的基本原理、架构、流程

大模型”（Large Model）通常指具有超大参数量（数十亿至万亿）海量训练数据和通用智能能力的深度学习模型。GPT 系列（OpenAI）文心、通义、百川、讯飞星火（中国）这些模型具备“通用语言理解与生成能力”，能完成多种任务：翻译、编程、问答、写作、推理、图像理解、代码生成等。模块核心内容架构基础训练目标预测下一个词关键阶段预训练 → 微调 → 推理优化方法量化、剪枝、蒸馏应用领域内容、代码、教育、医疗、游戏未来趋势多模态 + 低能耗 + 智能体。

2025-10-21 22:01:07 2902

原创（linux）centos联网，xshell连接不上，亲测好用，亲自走过的坑

注意：地址不要填xxx.xxx.xxx.0,那是子网，地址的最后一个点后面随便填一个不要和其他重复的就好，还有你们的第三位也不一定是“116”（这两是一样的操作，你连上了，但不稳定，要频繁开关网络）我的22就剩随便填的，没有特殊意义。还原默认设置，重新配子网IP。然后现在重复上面联网的操作。3那里就填8.8.8.8。连接完成，可以上网了。

2025-10-20 21:47:00 798

原创深度学习——循环神经网络（RNN）

循环神经网络（RNN）是深度学习中里程碑式的结构之一，它首次让神经网络具备了“记忆”的能力，为时间序列建模提供了强大工具。从最初的 RNN 到 LSTM、GRU，再到如今的 Transformer，序列建模经历了从时间依赖到全局注意力的演化。尽管在现代 NLP 中 Transformer 占据主导地位，但 RNN 的思想仍深刻影响着后续模型设计。理解 RNN，不仅是掌握深度学习的必经之路，更是理解时序智能的基础。

2025-10-20 09:02:31 1090

原创深度学习——循环神经网络（RNN）实战项目：基于PyTorch的文本情感分析

✅ 本项目展示了如何使用循环神经网络处理自然语言文本：学习序列依赖捕捉上下文语义应用于二分类情感分析📈替换为LSTM / GRU改进长距离依赖。添加增强泛化能力。使用进一步优化。

2025-10-19 21:57:16 1172 1

原创深度学习——YOLO 原理与各版本演化

版本年份核心结构特点与改进主干网络是否Anchor-freeYOLOv12015单阶段回归端到端检测Custom CNN否YOLOv22016Anchor机制Darknet-19否YOLOv32018多尺度检测残差连接、3层预测Darknet-53否YOLOv42020CSP+PANet否YOLOv52020PyTorch版CSPDarknet否YOLOv62022Rep结构Anchor-free、蒸馏✅YOLOv72022。

2025-10-18 23:40:39 1444

原创深度学习——基于ResNet18迁移学习的图像分类模型

通过继承该类通过.txt文件读取样本路径与类别标签，实现灵活的数据管理。本文完整展示了一个基于ResNet18 迁移学习的20类图像分类任务，从模型加载、参数冻结、数据增强、训练与验证流程，到优化器与学习率调度的全流程实现。通过冻结特征提取层、仅微调分类层的设计，我们能够以极低的训练成本获得高准确率模型，体现了迁移学习在现实任务中的高效性与实用价值。

2025-10-18 21:54:02 1055

原创深度学习——基于 ResNet18 的图像分类训练

该类通过文本文件（如train2.txt）加载图片路径和标签。使用交叉熵损失函数处理多分类任务，优化器为Adam。模块作用特点ResNet18特征提取主干使用 ImageNet 预训练权重Dataset读取图片与标签支持 transform 自动增强DataLoader批量化输入shuffle 提升训练效果train()前向传播与反向传播更新梯度Test()模型评估计算平均损失与准确率学习率调整自动降低学习率防止过拟合。

2025-10-17 20:50:49 1157

原创计算机视觉（opencv）——基于HSV颜色空间的实时颜色检测

该系统通过摄像头实时捕捉视频流，将图像从BGR空间转换为HSV空间，并通过设定阈值对指定颜色区域进行提取与显示，从而实现实时的颜色识别与可视化效果。与RGB不同，HSV将颜色和亮度分离，这意味着在光照变化的情况下，Hue与Saturation部分仍然保持较稳定的值，使得颜色检测更加稳健。例如，棕色、绿色等颜色在不同光照下RGB值变化明显，但HSV的Hue值变化范围较小，这使得检测更可靠。函数，可计算检测区域的重心，并绘制实时轨迹，实现类似激光笔跟踪的效果。将BGR图像转换为HSV空间，方便进行颜色分离。

2025-10-17 20:30:03 824

原创计算机视觉（opencv）——实时颜色检测

颜色识别的关键在于颜色空间的选择与阈值判定。人类的颜色感知主要由色调（Hue）、饱和度（Saturation）与亮度（Value）决定。OpenCV 默认读取的图像为BGR（蓝绿红）模式，但这种模式不利于分离颜色信息，因此通常将其转换为HSV 颜色空间。H（Hue）色调表示颜色的种类（0~180，对应红、橙、黄、绿、青、蓝、紫等色带）。S（Saturation）饱和度表示颜色的纯度，越高颜色越鲜艳。V（Value）亮度表示颜色的明暗程度。通过对 H 值的阈值范围判断，可以快速区分不同颜色。

2025-10-16 22:30:09 2153 1

原创计算机视觉（opencv）——基于 MediaPipe 的实时面部表情识别

本文介绍了一个从数据采集、模型训练到实时推理的端到端面部表情识别流程，使用 MediaPipe 提取 468 个面部关键点作为特征，采用经典机器学习方法进行训练并实时展示识别结果。该方案易于实现、便于扩展，适合作为原型系统与教学示例。后续可在数据质量、特征工程、模型优化与多模态融合方向继续改进，以提升准确率与鲁棒性。下面附上你提供的两段完整代码（未改动），可直接保存为脚本运行与调试。代码一：数据采集脚本import cv2import csvimport os。

2025-10-16 22:30:02 1272

原创计算机视觉（opencv）——人脸网格关键点检测

在人机交互、虚拟现实、增强现实、情绪识别、动作捕捉等计算机视觉领域中，人脸的精确识别与定位扮演着极其重要的角色。传统人脸检测方法通常只能检测人脸区域的矩形框，而现代深度学习技术的发展，使我们可以实现更加精细的“人脸关键点检测”和“人脸网格化”。本篇文章将以 OpenCV 和 MediaPipe 为基础，详细介绍人脸网格（Face Mesh）技术的原理与应用，并通过一段完整的 Python 代码，演示如何实时检测和绘制 478 个三维人脸关键点。

2025-10-15 22:39:17 1412 4

原创计算机视觉（opencv）——基于 MediaPipe 人体姿态检测

人体姿态估计（Pose Estimation）是计算机视觉中非常实用的模块，常用于动作识别、运动分析、人机交互、增强现实等场景。Google 的 MediaPipe 提供了一套开箱即用、实时性能优良且易用的姿态估计模型，结合 OpenCV 做图像 I/O 与显示，可以快速搭建原型。下面我将基于你给出的代码，从原理、逐行解析、参数与调优、可视化技巧、常见问题、扩展与工程化建议等方面做详尽讲解，帮助你把这段简单示例拓展成工程级代码或学术实验。

2025-10-15 22:19:52 1274

原创计算机视觉（opencv）——基于 MediaPipe 与机器学习的手势识别系统

本文系统实现了一个完整的“基于MediaPipe + 传统机器学习”的手势识别系统。✅利用MediaPipe获取21个手部关键点；将三维坐标展开为63维特征；采用标准化处理与多模型对比；支持实时摄像头推理；准确率可达90%以上。✅使用LSTM或CNN实现动态手势识别；引入多手检测；扩展更多手势类别；与智能家居或机器人系统联动。

2025-10-13 23:55:00 1552

原创计算机视觉（opencv）——基于 MediaPipe 实现手部关键点检测与可视化

MediaPipe是 Google Research 开源的跨平台机器学习推理与可视化框架，支持多种实时检测任务，例如：人脸检测与表情分析；手部检测与姿势追踪；全身骨骼姿态识别；物体检测与分割。在本例中，我们使用的是模块，用于检测手部的 21 个关键点并进行可视化绘制。通过本文的实战讲解，我们了解了如何利用模块结合OpenCV实现实时手部关键点检测与可视化。该方法无需手动训练模型，几行代码即可完成高质量的检测任务，为后续的手势识别、动作控制等应用打下坚实基础。

2025-10-13 21:54:50 1219

原创计算机视觉（opencv）——基于 MediaPipe 的手势识别系统

检测手部关键点（如手指、掌心、手腕等位置）；通过关键点之间的距离关系判断手指是否伸展或弯曲；根据手指伸展数量映射为具体的数字或手势。Google 的MediaPipe提供了高精度的手部检测与关键点跟踪模型，可实时返回21 个关键点坐标。我们可以基于这些坐标信息，计算手指弯曲程度，从而判断出用户展示的手势。本文展示了一个基于的实时手势识别系统。通过检测手部 21 个关键点并计算距离关系，我们能够识别从“0”到“10”的静态手势。该系统具有实时性强、部署简单、可扩展性高。

2025-10-12 22:02:34 1174 2

原创计算机视觉（opencv）——仿射变换（Affine Transformation）

mat_src：原始图像中的三个参考点；mat_dst：目标图像中这三个点的新位置。仿射矩阵由这三组对应关系自动计算。仿射变换是图像几何变换中最常用的技术之一，兼具数学的优雅与工程实用性。它通过三点对应法求出变换矩阵，实现平移、旋转、缩放、剪切等多种操作，同时保持图像的几何直线关系。用于计算仿射矩阵；用于执行变换。通过理解其数学原理与参数意义，我们可以更灵活地控制图像几何结构，实现从视觉校正到数据增强的各种应用。✅仿射变换矩阵是 2×3；需提供 3 对非共线点；warpAffine。

2025-10-11 22:45:27 1585

原创计算机视觉（opencv）——基于 OpenCV DNN 的实时人脸检测 + 年龄与性别识别

本文详解了基于OpenCV DNN模块的实时人脸检测与年龄性别识别系统。系统采用三类预训练模型实现人脸检测、年龄和性别识别功能，依赖OpenCV、Pillow和Numpy等库。文章详细解析了代码实现，包括模型加载、人脸检测、中文显示等关键环节，并指出当前使用整帧而非裁剪人脸区域的问题。针对性能优化，建议采用异步推理、分辨率管理和硬件加速等技术。此外，文章强调了模型存在的偏差问题，提醒注意隐私合规和伦理风险，建议在敏感场景下慎用。最后提供了落地实践清单，包括模型匹配验证、准确性提升和隐私保护措施等。

2025-10-10 21:37:43 1647 2

空空如也

空空如也