自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

转载 集成学习个人学习总结

说明:本科普也是借助诸多集成学习文章学习总结而来。集成学习一般我们常说的集成学习的方法都是指的同质个体学习器。而同质个体学习器使用...

2020-02-28 16:59:10 602

转载 机器学习——集成算法

机器学习——集成算法(一)集成算法原理1.1 Bagging模型1.2 Boosting模型1.3 Stacking模型(二)集成算法...

2020-02-28 16:57:46 444

转载 机器学习---集成学习

一、关于集成学习的概念1.集成学习概念集成学习是机器学习中一个非常重要且热门的分支,是用多个弱分类器构成一个强分类器,其哲学思想是...

2020-02-28 16:57:10 634

转载 机器学习——集成算法

本篇基于机器学习(edt:周志华)的集成学习章节,衍生学习多种boosting集成学习算法。集成学习(ensemblelearning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-calssifiersystem)。目前的集成学习方法大致可以分为两大类:•个体学习器间存在强...

2020-02-28 16:55:21 412

转载 sklearn K近邻法类库使用小结

原文链接 1. scikit-learn 中KNN相关的类库概述        在scikit-learn 中,与近邻法这一大类相关的类库都在sklearn.neighbors包之中。KNN分类树的类是KNeighborsClassifier,KNN回归...

2020-02-28 16:52:11 435

转载 Linux查看端口使用状态、关闭端口方法

Linux查看端口使用状态、关闭端口方法【摘要】      今天在编写socket,在期间遇到查看某个端口的状态,随后从网上找了一下,现在总结一下。【内容】      大家都知道,端...

2020-02-28 16:50:20 372

转载 内网渗透知识基础及流程

 前言现在网上内网渗透、域渗透文章很多,大多数人只知道如何进行操作获取全新,不知使用该技术的原理和该技术操作影响Windows何种功能,Windows何种机制对内网渗透产生的影响。本文按照数个Windows系统的功能进行讲解,完善内网渗透知识结构。 要点SAMHashActive DirectoryKerberosSMBIPCNetBIOSLLM...

2020-02-28 16:49:21 6266 1

转载 算法笔记- K均值(K-Means)

前言本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解。目录  k近邻(KNN)  决策树  线性回归  逻辑斯蒂回归  朴素贝叶斯  支持向量机(SVM)  组合算法(Ensemble Method)  K-Means  机器学习算法总结 本章主要介绍无监督学习中的k-means,以及简单代码实现。一、算法...

2020-02-28 11:58:37 885

转载 超参数调优方法整理大全

 机器学习中总是会碰见调参这种枯燥无味且消耗时间的事情,所幸,有很多可以帮助你自动调参的库以及相应的方法,在这里统一总结一下吧。一、随机森林超参数优化- RandomSearch和GridSearch(1)RandomSearch原理:超参数优化也就是常说的调参,python-sklear...

2020-02-28 11:52:06 8017 2

原创 文本处理

1.函数from sklearn.feature_extraction.text import CountVectorizerimport jiebafrom sklearn.feature_extraction.text import vect=CountVectorizer(ngram_range=(2,2)) # n-game模式en=['The quic...

2020-02-28 11:37:59 430

原创 模型评估与优化

1.交叉验证法from sklearn.model_selection import cross_val_scoresvc=SVC(kernel='linear')scores=cross_val_score(svc,x,y,cv=6)2.随机拆分和挨个试试from sklearn.model_selection import ShuffleSplit,cross_val_scor...

2020-02-28 11:20:16 584

原创 机器学习算法 3

一、聚类1.函数from sklearn.cluster import KMeans,DBSCANfrom scipy.cluster.hierarchy import dendrogram,ward1.1 K-Means k均值算法from sklearn.datasets import make_blobsfrom sklearn.cluster import KMeans,DB...

2020-02-27 20:51:30 350

转载 结合sklearn进行特征工程

1 前言该篇博客主要涉及到sklearn.feature_selection 以及其他相关模型,主要介绍了如何利用sklearn进行...

2020-02-27 17:37:25 838

转载 机器学习算法选择

本文主要回顾下几个常用算法的适应场景和优缺点!对于你的分类问题,你知道应该如何选择哪一个机器学习算法么?当然,如果你真的在乎精度(accuracy),最好的方法就是通过交叉验证(cross-validation)对各个算法一个个地进行测试,进行比较,然后...

2020-02-27 16:29:41 823

原创 机器学习算法 2

一、决策树1.函数from sklearn.tree import DecisionTreeClassifier,export_graphvizimport graphvizfrom sklearn.ensemble import RandomForestClassifier1.1决策树调参 max_depthclf_3=DecisionTreeClassifier(m...

2020-02-27 16:09:55 814

原创 机器学习算法 1

一、K最近邻1.调用函数—from sklearn.neighbors import KNeighborsClassifierclf=KNeighborsRegressor(n_neighbors=2)clf.fit(x,y)二、广义线性模型1.函数from sklearn.linear_model import LinearRegression,Ridge,Lasso对...

2020-02-27 15:14:51 372

转载 Python Pandas DataFrame 表格 打印输出不能对齐的两种解决方案

最近在学数据分析,中英文混合的DataFrame表格会出现print()打印无法对齐的情况,导致输出的结果都没有对齐,十分不美观,也...

2020-02-25 23:32:10 21184 8

转载 准确率、精确率、召回率、F1值、ROC/AUC整理笔记

原文链接地址:https://blog.csdn.net/u013063099/article/details/80964865   加了部分修改对于二分类问题,机器预测的和实际的还是会有所偏差,所以我们引入以下几个概念来评价分类器的优良。一、TP、TN、FP、FN概念首先有关TP、...

2020-02-25 16:00:50 712

转载 sklearn 神经网络MLPclassifier参数详解

class sklearn.neural_network.MLPClassifier(hidden_layer_sizes=(100,...

2020-02-23 22:51:17 6840

转载 Python中决策树分类器DecisionTreeClassifier参数和经验总结

class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, splitter=’best’, max_depth=None, min_samples_split=2, min_samples_leaf...

2020-02-23 00:08:34 21462

转载 详解ROC/AUC计算过程

ROC和AUC定义ROC...

2020-02-22 23:05:10 937

转载 交叉验证stratified k-fold cv与shuffle等常用cv方法

本文参考:https://scikit-learn.org/stable/modules/cross_validation.html...

2020-02-22 22:37:09 917

转载 RF(随机森林)、GBDT、XGBoost算法简介

一、概念RF、GBDT和XGBoost都属于集成学习(Ensemble Learning),集成学习的目的是通过结合多个基学习器的预测结果来改善单个学习器的泛化能力和鲁棒性。二、关系根据个体学习器的生成方式,目前的集成学习方法大致分为两大类:即个体学习器之间存在强依赖关系、必须串行生成的序列化方法,以及个体学习器间不存在强依赖关系、可同时生成的并行化方法;前者的代表就是Boosting,后者...

2020-02-22 17:44:02 1925

转载 机器学习十大经典算法之朴素贝叶斯(学习笔记整理)

简单描述建议观看

2020-02-22 15:38:56 284

原创 python mean()

2020-02-22 00:42:43 343

转载 用matplotlib作图的时候plot.show()时plot中的label为何显示不出来

在作图的时候,明明plt.plot()中设置了label的值,但是在图中plt.show()以后就是没有显示出来那个标签,如下图所示:此时,只需要添加一个函数plt.legend()用来标示不同图形的文本标签图例就行了。 ...

2020-02-21 23:53:27 10425 4

转载 机器学习十大经典算法之岭回归和LASSO回归(学习笔记整理)

在线性回归模型中,其参数估计公式为β=(XTX)−1XTyβ=(XTX)−1XTyβ=(XTX)−1XTyβ=(XTX)−1XTyβ=...

2020-02-21 23:20:48 1372

转载 [sklearn的一般流程】数据的获取

【sklearn的一般流程】数据的获取1.生成回归数据 make_regression()2.生成分类数据 make_classif...

2020-02-20 17:09:58 746

转载 NumPy

NumPy文章目录NumPyNumPy数组对象NumPy数据类型NumPy数组运算NumPy索引和切片NumPy数组组合NumPy数...

2020-02-19 23:47:16 561

转载 numpy中的np.c_和np.r_详解

【时间】2018.12.03【题目】numpy中的np.c_和np.r_详解 一、np.c_和np.r_用于连接两个矩阵np.r_中的r是row(行)的缩写,是按行叠加两个矩阵的意思,也可以说是按列连接两个矩阵,就是把两矩阵上下相加,要求列数相等,类似于pandas中的concat()。n...

2020-02-19 23:42:41 1754

转载 sklearn 快速入门教程

本教程使用于对理论知识具有一定的了解但编码能力稍弱且对sklearn不太了解的同学本文为转载文章,原文地址:https://www.cnblogs.com/lianyingteng/p/7811126.html 传统的机器学习任务从开始到建模的一般流程是:获取数据 -> 数据预处理 -> 训练建模...

2020-02-19 23:06:13 467

转载 sklearn函数汇总

Python笔记--sklearn函数汇总Summer Memories​关注他28 人赞同了该文章1. 拆分数据集为训练集和测试集:from sklearn.model_selection import train_test_splitx_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.2,rando...

2020-02-19 23:00:02 3865

转载 一篇搞定机器学习面试

序言本文尽可能的不涉及到繁杂的数学公式,把面试中常问的模型核心点,用比较通俗易懂但又不是专业性的语言进行描述。希望可以帮助大家在找工作时提纲挈领的复习最核心的内容,或是在准备的过程中抓住每个模型的重点。实战环境说明:Python 2.7 Sklearn 0.19.0 graphviz 0.8.1 决...

2020-02-19 22:48:11 467

转载 准确率、精确率、召回率、F1值、ROC/AUC整理笔记

对于二分类问题,机器预测的和实际的还是会有所偏差,所以我们引入以下几个概念来评价分类器的优良。一、TP、TN、FP、FN概念首先有关TP、TN、FP、FN的概念。大体来看,TP与TN都是分对了情况,TP是正类,TN是负类。则推断出,FP是把错的分成了对的,而FN则是把对的分成了错的。(我的记忆方法:首先看...

2020-02-19 22:28:40 817

转载 漏洞检测的那些事儿

Author: RickGray (知道创宇404安全实验室)Date: 2016-06-01好像很久没发文了,近日心血来潮准备谈谈 “漏洞检测的那些事儿”。现在有一个现象就是一旦有危害较高的漏洞的验证 PoC 或者利用 EXP 被公布出来,就会有一大群饥渴难忍的帽子们去刷洞,对于一个路人甲的我来说,看得有点眼红。XD刷洞归刷洞,蛋还是要扯的。漏洞从披露到研究员分析验证,再到 PoC 编写,...

2020-02-16 15:48:31 756

转载 Python 中使用 requests时遇到302重定向问题

...

2020-02-16 15:27:44 4897

转载 堆和栈的区别

堆和栈的区别(博客园):http://www.cnblogs.com/jiahuafu/p/8575044.html

2020-02-16 15:22:58 245

转载 ThinkPHP6 任意文件操作漏洞分析

公众号:https://mp.weixin.qq.com/s/UPu6cE20l24T6fkYOlSUJw漏洞介绍2020年1月10日,ThinkPHP团队发布一个补丁更新,修复了一处由不安全的SessionId导致的任意文件操作漏洞。该漏洞允许攻击者在目标环境启用session的条件下创建任意文件以及删除任意文件,在特定情况下还可以getshell。具体受影响版本为ThinkPHP6.0....

2020-02-15 23:26:19 2571

转载 Python—numpy.argsort()

2020-02-13 16:20:10 402

转载 Python NumPy中sum()函数详解 axis与keepdims图解

目录numy.sum()函数定义与说明代码示例、说明及输出axis = 0 或axis = -3axis = 1 或 axis = -2axis = 2或axis = -1axis = (0, 2)axis = (0, 2),keepdims=True总结与扩展经常使用NumPy的小伙伴会遇...

2020-02-13 16:09:33 2433

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除