井底哇哇-CSDN博客

原创 Windows 无法识别 .msi 安装包？五个步骤彻底修复

摘要：当双击.msi安装文件无反应时，可能是文件关联或Windows Installer服务异常。解决方法包括：1）检查文件扩展名和完整性；2）通过命令msiexec /unregister和/regserver修复关联；3）启用Windows Installer服务；4）用命令行msiexec /i直接安装；5）扫描系统文件或关闭安全软件。若问题仍存，可清理临时文件或切换管理员账户。多数情况下，前两步即可恢复安装功能。

2026-06-29 14:07:39 173

原创 HTML代码：输入HEX或RGB色值预览颜色

这篇文章介绍了一个颜色预览工具的HTML实现，主要功能包括：核心功能：用户输入HEX/RGB颜色值后，页面即时显示对应颜色的小色块和颜色数值输入支持：接受多种格式（#FFF/#FFFFFF、rgb(255,99,71)、128,0,128等）技术特点：实时预览功能（带防抖处理）智能错误提示响应式设计自动格式转换（RGB↔HEX）交互设计：包含主按钮触发和实时输入两种交互方式该工具适合设计师和开发者快速查看颜色效果，无需跳转页面即可获得直观的颜色展示。

2026-05-11 13:24:22 476

原创 Python点选坐标获取图像精确位置色彩编码

3.图片弹窗点选特定像素位置；2.弹窗里选取图片文件；4.显示该位置色彩编码；

2026-05-08 10:58:19 27

原创通用人工智能展望——来自Transformer、世界模型与人脑智能的启示

摘要：通用人工智能的发展正处在三大智能范式的交汇点：基于Transformer的自回归大模型、注重因果推理的世界模型架构和自然进化的人脑智能系统。Transformer擅长统计学习但缺乏深度理解，世界模型推进了因果推理但面临开放环境挑战，人脑则展现了资源优化下的生存智慧。三者优势互补：Transformer提供知识基础，世界模型贡献推理能力，人脑指明价值导向。未来通用AI将是统计知识、因果推理和价值决策的有机融合，需要突破多模态学习、内在动机、元认知等关键技术，同时解决价值对齐、资源效率等伦理挑战。这一演进

2025-10-13 09:54:58 501

原创 Dify工作流集成DeepSeek“联网搜索”功能实践

工作流如下图，首先获取了当前时间，需要注意的是设置正确时区，接下来获取的时间，作为上下文参数输入到大模型节点中，通过提升词，引导大模型根据当前时间，搜索近24小时的新闻，并结构化为新闻简讯文稿,(需要注意的是，该工作流开始节点，未预设输入提示词变量query,直接运行即可！验证结果完全符合，包括时间，真实性，领域等都满足工作流的基本需求，这种通过增加Dify插件实现的资讯获取方式，具有较高的灵活性，但每次构建工作流时，需要比较复杂的处理和配置，还需要写Python代码，对没有代码背景的人不够友好；

2025-08-11 12:46:55 2561

原创 RAG工作流程总览

问答检索阶段，首先将问题通过向量化模型，进行向量化转换，再在向量数据库中，通过不同检索等手段，匹配知识库中相关内容，再将匹配结果通过大模型润色后作为答案输出；该阶段根据原始文件，经过预处理，向量化等操作，最终将向量化模型，与知识库内容的向量化结果存储在向量知识库中备用；混合检索解决语义鸿沟问题（如搜索“苹果公司”不返回水果信息）解决术语变体问题（如“COVID-19”→新冠病毒）动态融合双路结果（例：向量权重70%+关键词30%）：用户提问（例：“新冠疫苗有哪些类型？

2025-07-30 15:39:14 1028

原创在 Dify 平台部署一个知识库问答（KBQA）工作流

加强检索约束，Prompt 加限制（“仅基于知识库回答”）：启用缓存，使用轻量级 LLM（如 Mistral-7B）（OpenAI Embedding、M3E、BGE等）（支持 PDF/TXT/Markdown/Word）（GPU/CPU 资源，用于向量数据库和模型推理）企业内部文档（PDF/Word/Excel）网页爬取数据（Markdown/HTML）分块大小（太小→信息碎片化，太大→噪声多）相似度阈值（太高→漏检，太低→噪声多）（是否返回正确文档）结构化数据（数据库/API）

2025-06-19 13:21:49 1468

原创大模型微调算法原理：从通用到专用的桥梁

本文聚焦大模型落地中的核心矛盾——理论快速发展与实际应用需求之间的脱节，并系统探讨微调技术作为解决这一矛盾的关键手段。尽管大模型展现出强大的通用能力，但其在垂直领域的直接应用仍面临适配性不足、计算成本高等挑战。微调通过在预训练模型基础上进行针对性优化，平衡通用知识与领域需求，成为实现高效部署的核心技术1）本文重点：本文系统梳理微调方法论，旨在为研究者和开发者提供技术选型方法论支持;2）本文缺陷：本文重方法论和思路梳理，不注重数学推导和代码实现；由于笔者才疏学浅，如有错误或疏漏敬请批评指正。

2025-05-10 12:54:29 1292

原创在 GitLab 中部署Python定时任务

在Python脚本中添加异常捕获，确保任务失败时能通知（如通过GitLab告警或邮件）。：如PostgreSQL、MySQL（需配置GitLab Runner访问权限）。在流水线中输出关键指标（如执行时间、结果统计），通过CI/CD变量记录。中部署定时任务（如每天早8点运行Python脚本并存储结果）可以通过。更灵活，但需额外配置数据库连接（如通过环境变量传递密码）。结果文件会保存在流水线页面，可直接下载，适合临时存储。：将结果保存为文件（如JSON/CSV）并提交到仓库。，可以高效实现定时脚本运行。

2025-05-06 13:46:55 1110

原创隐马尔可夫模型、贝叶斯概率模型与条件随机场三种概率图模型的比较

均基于概率图模型框架，解决不确定性推理问题；在序列建模任务中表现出色（HMM与CRF）；依赖图结构表达变量间的依赖关系。

2025-03-14 10:13:51 935

原创评估特征与二分类标签之间相关性的方法

通过综合使用统计检验、信息论和模型驱动方法，可全面评估特征与二分类标签的相关性。：先用快速方法（如卡方检验）初筛，再用计算密集型方法（如互信息）细选。：基于决策树（如随机森林、XGBoost）的分裂增益评估特征贡献。：同时评估多个特征时需校正p值（如Bonferroni校正）：区分连续/离散特征选择合适方法（如卡方检验仅用于分类特征）：任意特征类型（连续/离散）与二分类标签的非线性关系。：标准化均值差异，衡量二分类标签下连续特征的效应大小。：计算连续特征与二分类标签的线性相关性。

2025-03-03 14:00:53 1014

原创高斯平滑（Gaussian Smoothing）原理详解

高斯平滑通过模拟人眼对邻近信息的感知方式（近处细节清晰，远处模糊），利用高斯核的加权平均特性，在去噪与保留细节之间取得平衡。对称性：高斯函数在空间域是各向同性的（圆形对称），适用于图像中无方向性的平滑需求。，对邻域内的像素赋予不同的权重，距离中心像素越近的点权重越高，越远的点权重越低。其核心是利用高斯函数的。：抑制图像的高频分量（如噪声、锐利边缘），保留低频分量（平缓变化的区域）。σ（标准差）：控制分布的宽度，σ越大，曲线越平缓，平滑效果越强。σ越大，高斯核覆盖范围越广，平滑效果越强，但细节损失更多。

2025-02-26 17:07:01 2840

原创 Python 计算两个时间序列信号的相似性(KL散度方法)

相对熵（Relative Entropy），也称为Kullback-Leibler散度（Kullback-Leibler Divergence, KL散度），是衡量两个概率分布之间差异的一种方法。对于时间序列数据，可以通过将时间序列转换为概率分布（例如通过直方图或核密度估计），然后计算它们的KL散度来评估相似性。KL散度要求 Q(i)Q(i) 不能为零，否则计算会出错。可以通过平滑处理（如添加一个很小的值）来避免零值。

2025-02-11 14:01:11 774

原创 ChatGPT是强人工智能吗?

ChatGPT是强人工智能吗?本文从人工智能发展的三个阶段的角度,分析当前强大的AI大模型所处的阶段,并通过对比各阶段的定义,明确各阶段的特点和未来发展方向;Narrow AI（弱人工智能）、AGI（人工通用智能）和 ASI（人工超级智能）代表了人工智能发展的三个不同阶段，它们在智能水平、任务范围和应用场景上存在显著差异。

2025-01-22 14:49:08 1699

原创 Kmeans与KMedoids聚类对比以及python实现

K-Means 和 K-Medoids 都是常用的聚类算法，它们各有优缺点，适用于不同的场景。K-Means 算法计算效率高，适用于大规模数据集和凸形簇，但对噪声和异常值敏感。K-Medoids 算法对噪声和异常值不敏感，适用于小规模数据集和任意形状的簇，但计算复杂度较高。在实际应用中，需要根据具体问题选择合适的算法。

2025-01-22 10:03:29 920

原创混淆矩阵与二分类评估指标(精确率、查准率、查全率、误报率、漏报率、F1分数)

混淆矩阵是二分类问题中用于直观展示模型性能的二维矩阵，包含真正例、假正例、假负例和真负例四个元素。基于混淆矩阵，我们可以计算出准确率、精确率、召回率和F1值等二分类评估指标，这些指标从不同角度反映了模型的性能。通过分析这些指标，我们可以了解模型在不同类别上的分类情况，发现模型的不足之处，并有针对性地进行改进，从而提高模型的预测性能。

2025-01-07 11:52:57 1482

原创时序数据——异常类型及异常检测思路

时序数据异常检测是指在时间序列数据中识别出不符合预期模式的点或序列的过程。时序异常基于异常的特性和表现形式，可以分为"点异常","上下文异常","模式异常"三种类型;本文介绍时序数据三种异常类型,及对应检测时序异常的技术路线;1）本文重点：重点研究时序数据异常类型,及相应异常检测技术路线;2）本文缺陷：不探讨具体异常检测方法,由于笔者才疏学浅，如有疏漏敬请指正。

2025-01-03 17:15:08 2250

原创从RNN循环神经网络到长短时记忆网络LSTM

本文从一个简单的例子出发,介绍了RNN及其两种变体LSTM和GRU的基本原理,了解循环神经网络能够解决什么问题,以及能够应用在哪些领域。1）本文重点：本文重点研究RNN及其变体的原理和解决的问题;2）本文缺陷：本文为有倾向性的知识整理；由于笔者才疏学浅，重文字描述轻数学推导。前馈神经网络(feedforward neural network)是深度学习中最简单,也是最基础的网络结构,很多神经网络的变体,都是由前馈神经网络发展而来;

2024-12-31 15:51:02 1618

原创广义加性模型（GAM）原理简介及其Python实现

本文旨在深入探讨线性回归模型在解决实际问题中所面临的局限性，并以此作为出发点，详细阐述广义加性模型（Generalized Additive Model, GAM）如何有效地解决这些问题。通过逐步介绍GAM的核心思想、基本原理，以及基于pygam模块的Python实现,期望提供一个对GAM全面而深入的理解。1）本文重点：本文重点研究广义加性模型的核心思想与pygam实现;2）本文缺陷：原理介绍用于辅助核心思想理解,不做详细推导,由于笔者才疏学浅，如有疏漏敬请批评指正。

2024-12-31 10:08:59 7909

原创 Apline linux 安装scikit-learn 过程记录

本文记录了在Apline linux 安装scikit-learn时,踩坑填坑的过程,记录下来避免未来踩同样的坑~

2024-12-25 14:41:25 738

原创 Python国内10个镜像源-地址汇总以及测评

在Python开发环境中，选择合适的镜像源对于确保包的快速和可靠下载至关重要。以下是一些国内主要且广泛使用的Python镜像源地址，以及对每个镜像源的优势的对比;

2024-12-20 11:08:33 13467 1

原创 XGBoost:从决策树到极限梯度提升树

本文以决策树为出发点,以集成学习的发展路径为脉络,介绍XGBoost算法的优化思路及相关知识;

2024-12-06 16:27:51 2645 1

原创类别特征编码 ———特征工程

特征工程中，对类别型特征进行编码的12种方式

2024-08-23 17:53:20 1599 1

原创最小二乘法——参数估计过程推导

最小二乘法逐步推导过程记录

2023-08-24 14:16:37 2640

原创 OLS回归分析理论基础

由于目前的实证研究中需要对变量间的因果关系进行定量分析，所以以伍德里奇和陈强两版本计量经济学教材为基础，有针对性的整理出OLS回归的相关知识，以解决实证分析中的实际问题。1）本文重点：本文重点研究OLS下面板数据的有效性，重点关注遗漏变量问题2）本文缺陷：本文为有倾向性的知识整理，并非两本教材的整体综述；由于笔者才疏学浅，重文字描述轻数学推导。

2023-07-03 09:14:45 9430 1

原创 TOPSIS综合评价模型Python实现

1.TOPSIS法介绍2. 计算步骤（1）数据标准化（2）得到加权后的矩阵（3）确定正理想解和负理想解（4）计算各方案到正（负）理想解的距离（5）计算综合评价值3.实例研究3.1 导入相关库3.2 读取数据3.3 读取行数和列数3.4 数据标准化3.5 得到信息熵3.6 计算权重3.7 计算权重后的数据3.8 得到最大值最小值距离3.9 计算评分总代码。TOPSIS法 —— python_洋洋菜鸟的博客-CSDN博客_topsis python。

2023-02-08 13:11:35 2393

转载偏导数概念及题例转发

偏导数的概念以及例题转载

2022-12-01 11:34:22 386

原创灰色关联度与最大互信息系数的python简单实现

【代码】灰色关联度与最大互信息系数的python简单实现。

2022-10-20 10:16:54 880

转载信号EMD模态分解python简单实现

【代码】信号EMD模态分解python简单实现。

2022-08-23 17:37:57 2937

转载卡尔曼滤波信号预测python 简单实现

【代码】卡尔曼滤波信号预测python 简单实现。

2022-08-23 17:27:58 1399

转载 python scipy 实现信号滤波功能

通过python的scipy接口，对一维数组实现：低通滤波、高通滤波、带通滤波、带阻滤波功能。

2022-08-19 17:03:39 4006 1

原创 Python使用MICE填充缺失值的简单实现

Python使用MICE填充缺失值的简单实现。

2022-07-21 14:59:23 2989 5

原创 TCN时空卷积网络 python 简单实现

本文基本参照【python量化】用时间卷积神经网络（TCN）进行股价预测_敲代码的quant的博客-CSDN博客_卷积神经网络对时间序列的预测对TCN时空卷积网络进行简单的python实现,用于理解TCN网络运行机制并以备后查，运行环境为python3.8.6 ，创建项目目录如下： 1.其中test.csv和train.csv分别为测试和训练数据，为随机创建的回归数据，columns =[a1,a2,a3,a4,a5,a6,a7,a8,y] 其中y是标签列；2.run.py为执行脚本,实现训练-输出

2022-06-22 11:29:52 3804 7

主要介绍了机器学习项目开发流程

WEKA软件使用详细教程

随机搜索轮次中由于数据量太大导致score (r方) 计算值溢出,verbose 打印的cv轮次score结果全部为1

截取字符型时间数据的小时为int时，以下两种方式哪种比较好，为什么