![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
Evan Yi
不忘初心,砥砺前行!
展开
-
matplotlib绘制loss图(增大字体)
将trainloss存为txt文件,并从txt文件读取loss画出折线图import matplotlib.pyplot as pltdef ReadTxtName(rootdir): lines = [] with open(rootdir, 'r') as file_to_read: while True: line = file_to_read.readline() if not line: .原创 2020-06-24 15:32:25 · 2261 阅读 · 0 评论 -
随机森林特征选择
前言随机森林是以决策树为基学习器的集成学习算法。随机森林非常简单,易于实现,计算开销也很小,更令人惊奇的是它在分类和回归上表现出了十分惊人的性能,因此,随机森林也被誉为“代表集成学习技术水平的方法”。本文是对随机森林如何用在特征选择上做一个简单的介绍。随机森林(RF)简介只要了解决策树的算法,那么随机森林是相当容易理解的。随机森林的算法可以用如下几个步骤概括:用有抽样放回的方法(bootstrap)从样本集中选取n个样本作为一个训练集 用抽样得到的样本集生成一棵决策树。在生成的每一...转载 2020-07-15 22:33:47 · 6048 阅读 · 1 评论 -
机器学习中的数据预处理
标准化、归一化方法:sklearn.preprocessing里的Normalizer,StandardScaler,MinMaxScaler其中MinMaxScaler函数可以自己实现,代码如下:#相当于sklearn.preprocessing中的MinMaxScalerdef noramlization_minmax(data): minVals = data.mi...原创 2020-03-20 02:42:08 · 169 阅读 · 0 评论 -
机器学习中的特征选择方法
链接:https://www.cnblogs.com/HuZihu/p/12381752.htmlhttps://www.zhihu.com/question/28641663/answer/110165221例子:SelectKBest+F检验from sklearn.feature_selection import SelectKBest,f_classif#数据预处理过滤式...原创 2020-03-20 00:53:32 · 578 阅读 · 0 评论 -
特征融合、归一化/标准化、降维的顺序问题
一般都是先特征融合,再归一化,最后降维原创 2020-03-20 00:27:50 · 3040 阅读 · 2 评论 -
机器学习常用判断指标
结论:TP:预测为正向(P),实际上预测正确(T),即判断为正向的正确率TN:预测为负向(N),实际上预测正确(T),即判断为负向的正确率FP:预测为正向(P),实际上预测错误(F),误报率,即把负向判断成了正向FN:预测为负向(N),实际上预测错误(F),漏报率,即把正向判断称了负向Accuracy准确率=(TP+TN) / (TP+FP+TN+FN), 即预测正确的...转载 2019-11-14 08:56:58 · 1856 阅读 · 0 评论 -
svm+特征提取做分类
使用SVM做一个图片分类器,主要使用的技术是,各种特征提取方法加上PCA主成分提取,最后用SVM进行图片分类处理。特征提取这个东西还是比较简单的,前人做的工作很多,源代码也不少。主要采用的不变距、HOG、SIFT、LBP、信息熵、tamura纹理特征、面积和欧拉数等。主要从两个大的角度研究。一个是纹理特征,还有一个就是几何特征。总的来说,就是各种特征叠加然后到了整个分类器,慢慢调整最终达到比较...转载 2019-10-08 18:43:42 · 8609 阅读 · 0 评论 -
SVM核函数的选择问题
线性核和RBF的选择 如果训练样本的特征数量过于巨大,也许就不需要通过RBF等非线性核函数将其映射到更高的维度空间上,利用非线性核函数也并不能提高分类器的性能。利用linear核函数也可以获得足够好的结果,此外,也只需寻找一个合适参数C,但是利用RBF核函数取得与线性核函数一样的效果的话需要寻找两个合适参数(C, γ)。 分三种情况讨论:样本数量远小于特征数量:这种情况,利用情况利...转载 2019-10-08 18:35:20 · 352 阅读 · 0 评论 -
特征工程
原创 2019-09-08 16:25:24 · 97 阅读 · 0 评论 -
批量梯度下降(BGD)、随机梯度下降(SGD)以及小批量梯度下降(MBGD)的理解
https://www.cnblogs.com/lliuye/p/9451903.html转载 2019-04-08 09:19:19 · 299 阅读 · 0 评论 -
BP经典入门算法实例—鸢尾花的分类(Python)
Iris数据集(鸢尾花数据集下载,密码:ae1e)是常用的分类实验数据集,由Fisher,1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。...转载 2019-04-06 11:01:46 · 12788 阅读 · 7 评论