特征工程
文章平均质量分 70
Doris_H_n_q
这个作者很懒,什么都没留下…
展开
-
梯度下降
导包import numpy as npimport matplotlib.pyplot as plt%matplotlib inline构建数据集# 定义函数# f(x) = x**4 + x**3 + 5f = lambda x:x**4 + x**3 + 5x = np.linspace(-10,10,200)y = f(x)绘制图形plt.plot(...原创 2018-09-20 11:18:40 · 220 阅读 · 0 评论 -
ROC受试曲线AUC[TPR/ FPR/截断点/StratifiedKFold/KFold]
概念ROC和AUC定义 ROC全称是“受试者工作特征”(Receiver Operating Characteristic)。ROC曲线的面积就是AUC(Area Under the Curve)。AUC用于衡量“二分类问题”机器学习算法性能(泛化能力)。计算ROC需要知道的关键概念 首先,解释几个二分类问题中常用的概念:True Positive, Fal...原创 2018-09-22 13:21:53 · 4914 阅读 · 0 评论 -
【转】分类/回归模型评估—ROC,AUC,RMSE等指标/调参—Grid Search
看到此篇文章内容干货较多,转载过来学习。链接:https://www.52ml.net/20410.html参考:https://blog.csdn.net/shenxiaoming77/article/details/72626218https://blog.csdn.net/pacosonswjtu/article/details/56871762模型评估的方法 ...转载 2018-09-22 12:31:40 · 4888 阅读 · 0 评论 -
决策树[sklearn.tree/DecisionTreeClassifier/scatter/np.meshgrid/np.concatenate/Kfold/Cross-validation]
决策树概念举栗子import numpy as np引入数据:s= '''在1948年,香农引入了信息熵,将其定义为离散随机事件出现的概率,一个系统越是有序,信息熵就越低,反之一个系统越是混乱,它的信息熵就越高。所以信息熵可以被认为是系统有序化程度的一个度量。'''s_l = list(s)len(s_l)Out:93# 打乱顺序index = np.arange(...原创 2018-09-20 19:43:06 · 1214 阅读 · 0 评论 -
【转】使用sklearn做特征工程
逛博文看到此类干货好文章,故此转载原博主博文共同学习。转文:https://www.cnblogs.com/jasonfreak/p/5448385.html----------------------------------------------------------------------------------------------------------------使用s...转载 2018-09-24 22:02:28 · 224 阅读 · 0 评论 -
【转】sklearn.feature_selection特征选择
sklearn.feature_selection模块的作用是feature selection,而不是feature extraction。Univariate feature selection:单变量的特征选择单变量特征选择的原理是分别单独的计算每个变量的某个统计指标,根据该指标来判断哪些指标重要。剔除那些不重要的指标。 sklearn.feature_selectio...转载 2018-09-24 21:32:15 · 635 阅读 · 0 评论 -
【转】梯度下降法与反向传播
一、梯度下降法1.什么是梯度下降法顺着梯度下滑,找到最陡的方向,迈一小步,然后再找当前位,置最陡的下山方向,再迈一小步… 通过比较以上两个图,可以会发现,由于初始值的不同,会得到两个不同的极小值,所以权重初始值的设定也是十分重要的,通常的把W全部设置为0很容易掉到局部最优解,一般可以按照高斯分布的方式分配初始值。 2.有两种计算梯度的方法:(1)慢一些但是简单一些...转载 2018-09-17 17:20:48 · 320 阅读 · 0 评论 -
【转】数据处理——One-Hot Encoding
机器学习 数据预处理之独热编码(One-Hot Encoding)来源:https://blog.csdn.net/dulingtingzi/article/details/51374487https://www.cnblogs.com/haobang008/p/5911466.htmlhttps://blog.csdn.net/pipisorry/article/details/...转载 2018-09-17 22:37:06 · 339 阅读 · 0 评论 -
PCA降维实例[GridSearchCV求最优参]
降维概念 机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达,目前最多使用向量表达形式。 y是数据点映射后的低维向量表达,通常y的维度小于x的维度(当然提高维度也是可以的)。f可能是显式的或隐式的、线性的或非线性的。 目前大部分降维算法处理向量表达...原创 2018-09-22 17:37:23 · 2018 阅读 · 0 评论