自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Trisyp的博客

精通大数据及算法工程,根据经验总结一些学习笔记和学习心得

  • 博客(174)
  • 资源 (3)
  • 收藏
  • 关注

原创 数据分析(三)线性回归模型实现

线性回归在实际应用时需要对普通最小二乘法进行一些修改。普通最小二乘法只在训练数据上最小化错误,难以顾及所有数据。惩罚线性回归方法是一族用于克服最小二乘法( OLS)过拟合问题的方法。岭回归是惩罚线性回归的一个特例。岭回归通过对回归系数的平方和进行惩罚来避免过拟合。其他惩罚回归算法使用不同形式的惩罚项。

2024-04-01 17:56:07 938

原创 灰色预测模型GM(1,1)的全面讲解及python实现

1. 灰色预测的概念(1)灰色系统、白色系统和黑色系统白色系统是指一个系统的内部特征是完全已知的,既系统信息是完全充分的。黑色系统是一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加以观测研究。灰色系统介于白色和黑色之间,灰色系统内的一部分信息是已知的,另一部分信息是未知的,系统内各因素间有不确定的关系。(2)灰色预测法所以灰色预测就是通过这样的信息前提下做的一种预测分析,即灰色预测法是一种预测灰色系统的预测方法。灰色预测通过鉴别系统因素之间发展趋势的相异程度,

2020-05-27 10:21:03 23192 28

原创 AHP(层次分析法)的全面讲解及python实现

一、层次分析法的使用流程:1. 建立层次结构模型首先绘出层次结构图,正常三层是比较常见的:决策的目标、考虑的决策准则因素和决策对象。按它们之间的相互关系分为最高层、中间层和最低层(如下图是四层结构的)2. 分层构造判断矩阵。多层次的评价指标体系结构一般比较复杂,各种评价指标的权重难以确定,通过两两比较评价因子的重要性来确定权重要比一次性确定所有因子的权重容易把握。该方法叫一致矩阵法,即:不把所有因素放在一起比较,而是两两相互比较。对比时采用相对尺度,以尽可能减少性质不同因素相互比较的困难,以

2020-05-09 13:58:30 27821 6

原创 模拟退火算法(Simulated Annealing,SA)的全面讲解及python实现

抽象来源:美国物理学家Metropolis等人在1953年发表研究复杂系统,计算其中能量分布的文章时,使用蒙特卡洛模拟法计算多分子系统中分子能量分布。Kirkpatrick等人受其启发而发明了“模拟退火”这个名词,它模仿冶金过程中的退火原理,因为寻找问题的最优解(最值)即类似寻找系统的最低能量。因此系统降温时,能量也逐渐下降,而同样意义地,问题的解也“下降”到最值 核心思想:在冶金退火过程中,退...

2020-03-18 21:22:26 6588 1

原创 二分图匹配及匈牙利算法的全面讲解及python实现

1、背景在生活中常常遇到两组元素多对多匹配而又数目有限的情况,我们需要对其进行最大匹配数的分配,使效率最大化。例如,有一组压缩气缸和一组压缩活塞,每一个型号的压缩气缸有一个固定的内径大小,每一个型号的压缩活塞可以匹配内径在一定范围内的气缸,使用匈牙利算法得到活塞和气缸对大匹配数的方案。2、二分图定义二分图又称作二部图,是图论中的一种特殊模型。 设G=(V,E)是一个无向图,如果顶点V可...

2020-01-16 09:38:42 4142

原创 遗传算法(Genetic Algorithms)的全面讲解及python实现

一、主要思想遗传算法的工作方式源自于生物学,是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,不需要确定的规则就能自动获取和指导优化的搜索空间,自适应地调整搜索方向。具体流程见下图:传统上看,这...

2020-01-09 09:10:43 11968 2

原创 粒子群(PSO)优化算法(Particle Swarm Optimization)的全面讲解及python实现

1. 研究背景它的基本概念源于对鸟群觅食行为的研究。设想这样一个场景:一群鸟在随机搜寻食物,在这个区域里只有一块食物,所有的鸟都不知道食物在哪里,但是它们知道当前的位置离食物还有多远。最简单有效的策略:寻找鸟群中离食物最近的个体来进行搜索。PSO算法就从这种生物种群行为特性中得到启发并用于求解优化问题。用一种粒子来模拟上述的鸟类个体,每个粒子可视为N维搜索空间中的一个搜索...

2020-01-06 17:29:50 5373 1

原创 Python实现主成分分析、决策树和随机森林完整过程

先附上代码,学习笔记回头再补充完整代码如下:# -*- coding: utf-8 -*-# 关闭警告# import warnings# warnings.filterwarnings('ignore')# 宏观数据和烟草数据回归分析 计算回归系数import pandas as pdimport numpy as npimport matplotlib.pyplo...

2019-04-24 18:10:14 2157

原创 Python数据预处理-数据标准化(归一化)及数据特征转换

一、数据标准化(归一化)首先,数据标准化处理主要包括数据同趋化处理(中心化处理)和无量纲化处理。同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。无量纲化处理主要为了消除不同指标量纲的影响,解决数据的可比性,防止原始特征中量纲差异影响距离运算(比如欧氏距离的运算)。...

2019-04-18 10:06:08 27271 4

原创 Python实现支持向量机SVM(Support Vector Machine)完整过程

支持向量机(Support Vector Machine)属于有监督的机器学习算法,是一种二分类模型,可用于离散因变量的分类和连续因变量的预测。其本质是计算两个观测数据的距离,学习策略是间隔最大化,所寻找的是能够最大化样本间隔的决策边界,因此又被称为大间距分类器。因为它可使用一个名为核函数的技巧,来将非线性问题变换为线性问题,将低维线性不可分的空间转换为高维线性可分空间,所以它相对于其他单一分类...

2019-04-17 10:38:44 2519

原创 Python实现逻辑回归(LogisticRegression)完整过程

最近正在做的项目正好利用到了逻辑回归,所以正好系统的学习了下,本篇博文把自己的学习笔记、项目思路及代码都记录下来。它的计算原理很多网站和书籍都有介绍,就不在这班门弄斧了,主要还是记录自己如何实现一、逻辑回归简介Logistic Regression算法是通过训练数据中的正负样本,学习样本特征和样本标签的假设函数,它是典型的线性分类器,是广义线性模型的一种。它具有很强的可解释性,应用也非常广泛...

2019-04-15 19:00:22 40767 15

原创 python获取完整网页内容(即包括js动态加载的):selenium+phantomjs

查看网页源代码时并不完整,利用selenium和phantomjs抓取js动态加载的网页

2017-12-19 17:52:42 18302 2

原创 python模拟浏览器打开百度首页并登录或者点击首页新闻并保存网页

首先不知道怎么模拟打开浏览器的童鞋先看我的上篇文章:http://blog.csdn.net/Trisyp/article/details/78688106这篇文章涉及到前期配置,所以不会的一定要先查看下,配置完了之后再进一步学习本篇文章这篇文章主要功能是模拟登录百度账号;或者点击首页新闻,同时保存和打印网页源码过程就不多说,我尽量都加上了备注,直接附上代码:模拟登陆完整代码如下:f...

2017-12-04 19:06:06 8575 3

原创 MySQL嵌套查询详细笔记(子查询)

MySQL嵌套查询(子查询)

2017-11-06 18:08:36 67263

原创 双向循环神经网络(Bi-RNN)原理、实现与演进

自然语言处理(NLP)是人工智能的重要分支,旨在让计算机理解、生成人类语言。其核心任务包括词法分析、句法分析、语义理解等。近年来,深度学习方法特别是双向循环神经网络(Bi-RNN)显著提升了NLP性能。Bi-RNN通过正向和反向处理序列数据,能同时利用上下文信息,在命名实体识别、情感分析等任务中表现优异。虽然后续发展出LSTM、Transformer等更先进的架构,但Bi-RNN提出的双向编码思想仍是现代NLP模型的基础。这一技术演进展现了从简单RNN到复杂Transformer的问题驱动发展路径,持续推动

2026-03-23 17:32:57 28

原创 Jieba分词器完全使用指南:从安装到实战案例

本文全面介绍了Python中文分词库Jieba的核心功能与应用场景。首先详解了Jieba的四种分词模式(精确、全、搜索引擎、Paddle模式)及其适用场景,并提供了带注释的代码示例。其次介绍了词典调整方法,包括自定义词典、动态修改和词频调节。然后讲解了关键词提取(TF-IDF和TextRank算法)、停用词过滤和词频统计等进阶功能。最后通过新闻关键词提取实战案例,展示了Jieba在实际项目中的综合应用。文章包含大量代码示例和输出解释,可作为Jieba分词的完整参考指南。

2026-03-19 11:08:14 671

原创 Word2vec核心模型精讲:CBOW与Skip-gram

Word2vec是Google提出的词向量模型,通过CBOW和Skip-gram两种神经网络架构将词汇映射到低维向量空间。CBOW通过上下文预测中心词,训练速度快但高频词表现更好;Skip-gram则相反,通过中心词预测上下文,适合处理生僻词。为解决softmax计算效率问题,Word2vec引入基于哈夫曼树的Hierarchical Softmax优化技术,将复杂度从O(V)降至O(logV)。文章详细解析了两种模型的原理差异,并演示了哈夫曼树的构造过程及其在词向量训练中的关键作用,这种结合词频的优

2026-03-14 17:31:24 422

原创 数据安全员理论总结

数据安全员理论知识汇总

2025-09-22 08:49:45 331

原创 高级网络信息安全管理员实操

本文介绍了系统安全管理的三个关键操作:1. Linux IP访问控制,通过iptables配置特定IP/IP段的访问权限;2. Windows日志管理,包括登录审核和事件查看器使用方法;3. Windows注册表防护,涉及权限设置、自启动项检查及运行记录查询。这些操作涵盖了网络访问控制、日志审计和系统安全防护等基础安全配置要点。

2025-09-11 09:49:33 418

原创 电压等级在电力系统中的使用场景

电压等级在电力系统中的使用场景

2025-08-12 17:35:25 1494

原创 目标检测系列(六)labelstudio实现自动化标注

利用已经训练好的yolo模型,加载到labelstudio实现自动化标注

2025-07-22 17:34:51 2967

原创 目标检测系列(五)已标注数据集(yolo格式)导入labelstudio继续标注

将已标注数据集(yolo格式)导入labelstudio继续标注

2025-07-01 17:38:08 1663 1

原创 Linux命令删除乱码文件

用Linux命令删除中文乱码文件

2025-03-26 11:32:00 355

原创 win11找不到hosts文件该如何处理

win11找不到hosts文件,恢复hosts文件

2025-03-21 16:10:12 1300

原创 Ubuntu上查看GPU使用情况并释放内存

Ubuntu上查看GPU使用情况并释放内存

2025-03-21 11:19:41 1020

原创 PDF转JPG(并去除多余的白边)

PDF转JPG,并去除多余的白边

2025-03-06 16:52:18 857

原创 本地化部署deepseek,并搭建聊天窗口来时时chat

本地化部署deepseek,并搭建聊天窗口来时时chat

2025-02-27 11:43:35 716

原创 电子元器件识别图大全、符号对照表

电子元器件识别图大全、符号对照表

2025-02-26 15:47:57 3359

原创 svg文件转为pdf或者jpg

svg文件转为pdf或者jpg

2025-02-26 09:47:31 411

原创 python实用教程(十二):python3的开发环境打包迁移(离线和在线)

python3开发环境的高效快速打包迁移(离线和在线)

2024-12-04 10:16:20 2468

原创 数据分析师常用Linux命令汇总

数据分析师常用Linux命令汇总

2024-12-03 16:16:58 244

原创 python实用教程(十):Linux下python3的开发环境配置流程

Linux下python3的开发环境配置流程

2024-12-03 15:40:44 823

原创 目标检测系列(三)yolov2的全面讲解

YOLOv2使用Darknet-19,YOLO9000: Better, Faster, Stronger

2024-09-24 17:28:00 1968

原创 目标检测系列(一)什么是目标检测

目标检测(Object Detection)简介

2024-09-24 09:32:23 4659

原创 Linux下MySQL5.7安装步骤

Linux下MySQL5.7安装步骤

2024-09-03 14:26:49 892 1

原创 微电网管理系统

微电网(MG)由分布式电源、用电负荷、能量管理系统等组成,是一个能够基本实现内部电力电量平衡的供用电系统

2024-09-03 14:18:24 1929

原创 弧闪分析计算及预防措施

弧闪分析计算及预防措施

2024-08-27 10:51:06 2216

原创 变压器涌流&浪涌

浪涌的含义、产生、危害及防护措施;变压器和应涌流现象分析

2024-08-27 10:48:15 2439

原创 python实用教程(二):安装配置Pycharm及使用(Win10)

保姆级教程:安装配置Pycharm,及pycharm的使用技巧

2024-08-20 11:41:05 1327

原创 python实用教程(一):安装配置anaconda(Win10)

保姆级教程:安装配置anaconda

2024-08-20 10:19:02 811

数据安全员实操技能题库.docx

内容概要:本文档围绕数据安全员的实际操作技能展开,涵盖Linux系统权限管理、MySQL数据库敏感信息处理、系统日志分析、加密解密操作及Sysmon安全监控工具的部署与配置。通过具体命令演示了目录与文件权限设置、用户与组管理、数据库脱敏(如MD5加密、手机号掩码)、SSH日志查看、日志归集打包、使用CyberChef进行RSA加密解密,以及Sysmon的安装与配置更新,全面提升数据安全防护能力。; 适合人群:具备基本Linux操作系统、数据库和网络安全知识的信息安全从业人员、数据安全管理员或相关专业学生,尤其适合准备从事数据保护、安全运维岗位的技术人员。; 使用场景及目标:①掌握Linux环境下文件与目录的精细化权限控制方法;②实现数据库中身份证号、手机号等敏感数据的脱敏处理;③熟练运用系统日志进行安全审计与异常行为追踪;④利用加密工具保障数据传输安全;⑤部署Sysmon实现Windows系统层面的行为监控与入侵检测。; 阅读建议:本资源强调动手实践,建议在虚拟机或测试环境中同步操作,深入理解每条命令的作用及其安全意义,结合实际应用场景灵活调整配置,强化安全防护意识与应急响应能力。

2025-09-22

储能应用及发展方向研究

信息化赋能储能场景,场景联动构建能源互联网。源、网侧,电力交易市场加速推进,提升经济收益是储能主体的核心诉求。以风光配储新能源电站为例,储能EMS与发电预测、电力交易形成联动,在满足电网调度控制需求的前提下,一方面一体化数据打通和协同能够帮助电站形成更合理的储能充放电策略,在交易市场获得更有利的交易价格,直接提升储能收益。另一方面储能EMS综合考虑电池系统各类参数,进行优化运行策略和控制策略的设计以减少控制成本。

2024-08-27

潮流分析预警技术调研文档

通过潮流计算可以判断电网母线电压、支路电流和功率是否越限,如果有越限,就应采取措施,调整运行方式。对于正在规划的电力系统,通过潮流计算,可以为选择电网供电方案和电气设备提供依据。潮流计算还可以为继电保护和自动装置整定计算、电力系统故障计算和稳定计算等提供原始数据。

2024-08-27

AI for Math Resources

This is a preliminary list of resources for those looking to get into the field of AI for Math, put together as part of the AI to Assist Mathematical Reasoning workshop (the official workshop proceedings can be found in the link here). It is not complete, but hopefully once distributed, it can continue to grow. url: https://docs.google.com/document/d/1kD7H4E28656ua8jOGZ934nbH2HcBLyxcRgFDduH5iQ0/edit

2024-04-17

yolo发展历程详细介绍

yolo发展历程详细介绍

2023-06-27

词典(百度LAC分词)

百度LAC分词需要的自定义字典、停词字典

2023-02-23

匈牙利算法理论根据证明新探.pdf

分配问题 是管理数学中线性规划的一个重要类型。 它可以用单纯形法求解 , 但 由于其模型的特殊性 , 一般都采用特殊的解法--匈牙利算法。匈本文利用矩阵给出了匈牙利算法的理论依据。

2020-01-16

粒子群优化算法的数学基础.pdf

粒子群算法的部分理论推导及推论证明,有数学基础的或者想自己推导公式及证明的可以下载学习,尤其是该算法的稳定性条件及收敛性分析。

2020-01-06

遗传算法的数学基础.pdf

遗传算法希望在期望值意义下越来越好,这样自然应当是一个下鞅序列。为了保证遗传算法的收敛性,有两个参数是非常重要的:一是过程进入满意解后下一步脱离满意解集的可能性;二是过程未进入满意解时下一步仍不能进入满意解的可能性。本书主要从数学几何角度介绍了遗传算法,并结合马尔科夫链等证明其收敛性质。

2020-01-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除