- 博客(185)
- 资源 (3)
- 收藏
- 关注
原创 数据分析(三)线性回归模型实现
线性回归在实际应用时需要对普通最小二乘法进行一些修改。普通最小二乘法只在训练数据上最小化错误,难以顾及所有数据。惩罚线性回归方法是一族用于克服最小二乘法( OLS)过拟合问题的方法。岭回归是惩罚线性回归的一个特例。岭回归通过对回归系数的平方和进行惩罚来避免过拟合。其他惩罚回归算法使用不同形式的惩罚项。
2024-04-01 17:56:07
967
原创 灰色预测模型GM(1,1)的全面讲解及python实现
1. 灰色预测的概念(1)灰色系统、白色系统和黑色系统白色系统是指一个系统的内部特征是完全已知的,既系统信息是完全充分的。黑色系统是一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加以观测研究。灰色系统介于白色和黑色之间,灰色系统内的一部分信息是已知的,另一部分信息是未知的,系统内各因素间有不确定的关系。(2)灰色预测法所以灰色预测就是通过这样的信息前提下做的一种预测分析,即灰色预测法是一种预测灰色系统的预测方法。灰色预测通过鉴别系统因素之间发展趋势的相异程度,
2020-05-27 10:21:03
23361
28
原创 AHP(层次分析法)的全面讲解及python实现
一、层次分析法的使用流程:1. 建立层次结构模型首先绘出层次结构图,正常三层是比较常见的:决策的目标、考虑的决策准则因素和决策对象。按它们之间的相互关系分为最高层、中间层和最低层(如下图是四层结构的)2. 分层构造判断矩阵。多层次的评价指标体系结构一般比较复杂,各种评价指标的权重难以确定,通过两两比较评价因子的重要性来确定权重要比一次性确定所有因子的权重容易把握。该方法叫一致矩阵法,即:不把所有因素放在一起比较,而是两两相互比较。对比时采用相对尺度,以尽可能减少性质不同因素相互比较的困难,以
2020-05-09 13:58:30
27929
6
原创 模拟退火算法(Simulated Annealing,SA)的全面讲解及python实现
抽象来源:美国物理学家Metropolis等人在1953年发表研究复杂系统,计算其中能量分布的文章时,使用蒙特卡洛模拟法计算多分子系统中分子能量分布。Kirkpatrick等人受其启发而发明了“模拟退火”这个名词,它模仿冶金过程中的退火原理,因为寻找问题的最优解(最值)即类似寻找系统的最低能量。因此系统降温时,能量也逐渐下降,而同样意义地,问题的解也“下降”到最值 核心思想:在冶金退火过程中,退...
2020-03-18 21:22:26
6646
1
原创 二分图匹配及匈牙利算法的全面讲解及python实现
1、背景在生活中常常遇到两组元素多对多匹配而又数目有限的情况,我们需要对其进行最大匹配数的分配,使效率最大化。例如,有一组压缩气缸和一组压缩活塞,每一个型号的压缩气缸有一个固定的内径大小,每一个型号的压缩活塞可以匹配内径在一定范围内的气缸,使用匈牙利算法得到活塞和气缸对大匹配数的方案。2、二分图定义二分图又称作二部图,是图论中的一种特殊模型。 设G=(V,E)是一个无向图,如果顶点V可...
2020-01-16 09:38:42
4192
原创 遗传算法(Genetic Algorithms)的全面讲解及python实现
一、主要思想遗传算法的工作方式源自于生物学,是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,不需要确定的规则就能自动获取和指导优化的搜索空间,自适应地调整搜索方向。具体流程见下图:传统上看,这...
2020-01-09 09:10:43
12053
2
原创 粒子群(PSO)优化算法(Particle Swarm Optimization)的全面讲解及python实现
1. 研究背景它的基本概念源于对鸟群觅食行为的研究。设想这样一个场景:一群鸟在随机搜寻食物,在这个区域里只有一块食物,所有的鸟都不知道食物在哪里,但是它们知道当前的位置离食物还有多远。最简单有效的策略:寻找鸟群中离食物最近的个体来进行搜索。PSO算法就从这种生物种群行为特性中得到启发并用于求解优化问题。用一种粒子来模拟上述的鸟类个体,每个粒子可视为N维搜索空间中的一个搜索...
2020-01-06 17:29:50
5464
1
原创 Python实现主成分分析、决策树和随机森林完整过程
先附上代码,学习笔记回头再补充完整代码如下:# -*- coding: utf-8 -*-# 关闭警告# import warnings# warnings.filterwarnings('ignore')# 宏观数据和烟草数据回归分析 计算回归系数import pandas as pdimport numpy as npimport matplotlib.pyplo...
2019-04-24 18:10:14
2173
原创 Python数据预处理-数据标准化(归一化)及数据特征转换
一、数据标准化(归一化)首先,数据标准化处理主要包括数据同趋化处理(中心化处理)和无量纲化处理。同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。无量纲化处理主要为了消除不同指标量纲的影响,解决数据的可比性,防止原始特征中量纲差异影响距离运算(比如欧氏距离的运算)。...
2019-04-18 10:06:08
27336
4
原创 Python实现支持向量机SVM(Support Vector Machine)完整过程
支持向量机(Support Vector Machine)属于有监督的机器学习算法,是一种二分类模型,可用于离散因变量的分类和连续因变量的预测。其本质是计算两个观测数据的距离,学习策略是间隔最大化,所寻找的是能够最大化样本间隔的决策边界,因此又被称为大间距分类器。因为它可使用一个名为核函数的技巧,来将非线性问题变换为线性问题,将低维线性不可分的空间转换为高维线性可分空间,所以它相对于其他单一分类...
2019-04-17 10:38:44
2563
原创 Python实现逻辑回归(LogisticRegression)完整过程
最近正在做的项目正好利用到了逻辑回归,所以正好系统的学习了下,本篇博文把自己的学习笔记、项目思路及代码都记录下来。它的计算原理很多网站和书籍都有介绍,就不在这班门弄斧了,主要还是记录自己如何实现一、逻辑回归简介Logistic Regression算法是通过训练数据中的正负样本,学习样本特征和样本标签的假设函数,它是典型的线性分类器,是广义线性模型的一种。它具有很强的可解释性,应用也非常广泛...
2019-04-15 19:00:22
40822
15
原创 python获取完整网页内容(即包括js动态加载的):selenium+phantomjs
查看网页源代码时并不完整,利用selenium和phantomjs抓取js动态加载的网页
2017-12-19 17:52:42
18334
2
原创 python模拟浏览器打开百度首页并登录或者点击首页新闻并保存网页
首先不知道怎么模拟打开浏览器的童鞋先看我的上篇文章:http://blog.csdn.net/Trisyp/article/details/78688106这篇文章涉及到前期配置,所以不会的一定要先查看下,配置完了之后再进一步学习本篇文章这篇文章主要功能是模拟登录百度账号;或者点击首页新闻,同时保存和打印网页源码过程就不多说,我尽量都加上了备注,直接附上代码:模拟登陆完整代码如下:f...
2017-12-04 19:06:06
8609
3
原创 重装 Visual C++ 的完整流程-BAT版
摘要:本文提供了一个批处理脚本(Reinstall-VisualCpp.bat),用于一键重装Visual C++运行库。脚本会自动请求管理员权限,执行三步操作:1)使用AIO工具卸载所有现有VC++运行库;2)重新安装AIO整合包;3)单独安装微软官方2015-2022版运行库(x86/x64)。执行前会检查所需安装包是否存在,每个步骤都有错误检测,完成后建议重启系统。用户只需双击运行该bat文件并在UAC提示中授权即可完成全自动重装流程。
2026-06-17 21:41:15
52
原创 重装 Visual C++ 的完整流程-PowerShell 版
摘要:这是一个PowerShell脚本,用于一键重装Visual C++运行库(2005-2026)。脚本会分三步执行:1)使用VisualCppRedist_AIO工具卸载所有已安装的运行库;2)重新安装所有运行库;3)补充安装微软官方的2015-2022运行库。使用前需将脚本与三个安装包(VisualCppRedist_AIO_x86_x64.exe、VC_redist.x64.exe和VC_redist.x86.exe)放在同一目录,并以管理员身份运行。脚本执行完毕后建议重启电脑。该方案结合了第三方工
2026-06-17 21:39:06
358
原创 Win10及以上版本安装nvm和nodejs
本文介绍了如何在Windows上使用nvm-windows管理Node.js版本。首先需卸载现有Node.js和yarn以避免冲突,重启后安装nvm-windows。安装步骤包括下载最新版本、运行安装程序,并通过nvm-v验证安装。使用时需以管理员身份运行PowerShell,通过nvminstalllts安装LTS版本,或指定版本号如nvminstall22.22.3。安装Node时会自动安装对应版本的npm,无需单独安装。文中还提到可通过nvmlistavailable查看可用版本。
2026-05-28 10:42:13
24
原创 将本地 HTML 网页通过 Nginx + Ngrok (或cpolar)暴露到公网
本文介绍了如何通过Nginx和Ngrok搭建本地网页并实现公网访问的完整流程。首先创建专用目录存放网页文件,安装配置Nginx服务并修改端口为8080;然后下载Ngrok配置Token建立隧道,获取公网访问链接;最后使用Formspree实现表单数据自动发送到邮箱的功能。针对Ngrok免费版的拦截页问题,推荐使用cpolar作为替代方案,提供无拦截页的中文界面服务。整个过程无需服务器配置,适合快速搭建临时展示页面。
2026-05-19 15:42:59
24
原创 龙虾OpenClaw配置飞书创建机器人详细步骤
说明:--workspace 指定了这只龙虾的独立工作目录,所有该龙虾的配置、记忆、会话数据都会保存在这个目录下,与其他龙虾完全隔离。点击权限管理-->批量导入/导出权限-->将JSON内容复制进去-->点击下一步-->点击申请开通-->点击确认开启-->点击确认。点击工作台-->点击创建应用-->跳转网页后登录并点击开发者后台-->点击创建企业自建应用-->输入应用名称和描述,点击创建。点击事件与回调-->点击订阅方式-->点击保存-->点击添加事件-->输入接收搜索并勾选接收消息-->点击添加。
2026-05-14 16:31:22
137
原创 sudo npm uninstall -g @openai/codex报错问题解决办法
文章摘要:针对Codex CLI安装报错"Missing optional dependency @openai/codex-linux-x64"问题,提供了完整的Ubuntu解决方案。首先建议通过卸载后使用国内镜像源重新安装(npm install -g @openai/codex@latest --registry=https://registry.npmmirror.com)。若仍失败,可采用本地安装方案:创建.npm-global目录避免权限问题,配置环境变量后安装。最后通过co
2026-04-25 18:21:41
1022
原创 NLP 算法工程师面试题集
*答案**:传统的 Seq2Seq 模型将所有输入信息编码成一个固定长度的上下文向量,这会导致**信息瓶颈**,特别是对于长句子,早期信息容易丢失。**答案**:Transformer 的自注意力机制本身是**置换不变的**,即如果把输入词的顺序打乱,输出结果在对应位置上依然相同。数学上,它是交叉熵的指数形式。- **LN 的优势**:LayerNorm 对每个样本的**特征维度**进行归一化,不受 batch size 和序列长度的影响,计算稳定,且与 Transformer 的架构自然契合。
2026-04-16 11:19:15
78
原创 箱变AI转型方向汇总
摘要:本文探讨AI技术在箱式变电站智能运维中的应用。通过数字孪生技术实现设备状态实时监控与故障预测,采用多模态传感器融合提升复杂环境下的缺陷识别准确率。引入大语言模型自动生成验收报告,将验收时间缩短83%。提出"智能巡视+远程操作"新模式,使巡检效率提升75%,操作时间减少53%。这些技术革新推动变电站运维向无人化、高效化转型,显著提升安全性和响应速度。(149字)
2026-04-16 10:51:31
393
原创 使用 APScheduler 实现精细化的定时任务
本文介绍了Python定时任务库APScheduler的核心功能与使用方法。APScheduler提供三种触发器(日期、间隔、cron表达式)支持各类定时需求,包含四个核心组件:触发器定义执行时间、任务存储器持久化作业、执行器管理任务运行、调度器协调整体流程。文章详细说明了各种调度器类型的选择、执行器配置建议以及任务存储器的持久化方案,并提供了完整的代码示例。此外还总结了时区处理、作业冲突等常见问题的解决方案,帮助开发者快速掌握这一强大的定时任务框架。
2026-04-15 16:36:40
537
原创 大模型工业应用案例
本文系统梳理了12项基础技术及其核心应用:1)统计分析实现数据预测;2)机器学习完成大数据挖掘;3)大语言模型处理文本解析;4)检索增强生成整合企业知识库;5)智能体构建任务工作流;6)计算机视觉实现图像理解;7)语音处理完成声音分析;8)多模态学习处理跨媒体数据;9)知识图谱支撑复杂推理;10)联邦学习保障隐私安全;11)边缘智能实现终端部署;12)三维点云处理工业检测。这些技术共同构成了从数据处理、智能分析到系统部署的完整技术链条,支撑工业智能化和自动化应用。
2026-04-15 16:20:49
70
原创 大模型技术演进综述:从Transformer奠基到智能体时代的架构创新
本文系统梳理了大语言模型(LLM)的技术演进历程:2017-2018年奠基期,Transformer架构革命性地取代RNN/CNN,GPT-1和BERT确立预训练范式;2019-2020年规模竞赛期,GPT-3验证了参数扩展带来的涌现能力;2021-2023年架构优化期,MoE和RLHF分别解决计算效率与对齐问题;2024-2025年效率革命期,混合架构和长上下文处理成为重点;2026年进入智能体时代,记忆增强和专用优化成为新方向。演进主线从追求模型规模转向优化计算效率,通过稀疏化、混合架构等技术平衡性能与
2026-03-31 10:08:23
85
原创 双向循环神经网络(Bi-RNN)原理、实现与演进
自然语言处理(NLP)是人工智能的重要分支,旨在让计算机理解、生成人类语言。其核心任务包括词法分析、句法分析、语义理解等。近年来,深度学习方法特别是双向循环神经网络(Bi-RNN)显著提升了NLP性能。Bi-RNN通过正向和反向处理序列数据,能同时利用上下文信息,在命名实体识别、情感分析等任务中表现优异。虽然后续发展出LSTM、Transformer等更先进的架构,但Bi-RNN提出的双向编码思想仍是现代NLP模型的基础。这一技术演进展现了从简单RNN到复杂Transformer的问题驱动发展路径,持续推动
2026-03-23 17:32:57
69
原创 Jieba分词器完全使用指南:从安装到实战案例
本文全面介绍了Python中文分词库Jieba的核心功能与应用场景。首先详解了Jieba的四种分词模式(精确、全、搜索引擎、Paddle模式)及其适用场景,并提供了带注释的代码示例。其次介绍了词典调整方法,包括自定义词典、动态修改和词频调节。然后讲解了关键词提取(TF-IDF和TextRank算法)、停用词过滤和词频统计等进阶功能。最后通过新闻关键词提取实战案例,展示了Jieba在实际项目中的综合应用。文章包含大量代码示例和输出解释,可作为Jieba分词的完整参考指南。
2026-03-19 11:08:14
857
原创 Word2vec核心模型精讲:CBOW与Skip-gram
Word2vec是Google提出的词向量模型,通过CBOW和Skip-gram两种神经网络架构将词汇映射到低维向量空间。CBOW通过上下文预测中心词,训练速度快但高频词表现更好;Skip-gram则相反,通过中心词预测上下文,适合处理生僻词。为解决softmax计算效率问题,Word2vec引入基于哈夫曼树的Hierarchical Softmax优化技术,将复杂度从O(V)降至O(logV)。文章详细解析了两种模型的原理差异,并演示了哈夫曼树的构造过程及其在词向量训练中的关键作用,这种结合词频的优
2026-03-14 17:31:24
476
原创 高级网络信息安全管理员实操
本文介绍了系统安全管理的三个关键操作:1. Linux IP访问控制,通过iptables配置特定IP/IP段的访问权限;2. Windows日志管理,包括登录审核和事件查看器使用方法;3. Windows注册表防护,涉及权限设置、自启动项检查及运行记录查询。这些操作涵盖了网络访问控制、日志审计和系统安全防护等基础安全配置要点。
2025-09-11 09:49:33
488
原创 目标检测系列(五)已标注数据集(yolo格式)导入labelstudio继续标注
将已标注数据集(yolo格式)导入labelstudio继续标注
2025-07-01 17:38:08
1758
1
数据安全员实操技能题库.docx
2025-09-22
储能应用及发展方向研究
2024-08-27
潮流分析预警技术调研文档
2024-08-27
AI for Math Resources
2024-04-17
匈牙利算法理论根据证明新探.pdf
2020-01-16
遗传算法的数学基础.pdf
2020-01-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅