- 博客(5)
- 收藏
- 关注
原创 特征工程与scikit-learn
欢迎关注我的公众号:AI_Engine。知乎,简书同名呦~今日头条搜索:极意就是在下啦!欢迎转发,评论噢!Filter过滤法过滤法通常在预处理阶段使用,特征选择完全独立于任何算法之外。方差过滤 **本质:** 使用特征本身的方差来消除方差小于阈值的特征。 **API:** VarianceThreshold **实例:**import pandas a...
2020-02-16 04:19:29
135
原创 数据挖掘与scikit-learn浅出
数据无量纲化在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。譬如梯度和矩阵为核心的算法中,譬如逻辑回归,支持向量机,神经 网络,无量纲化可以加快求解速度;而在距离类模型,譬如K近邻,K-Means聚类中,无量纲化可以帮我们提升模型精度,避免某一个取值范围特别大的特征对距离计算造成影响。数据的无量纲化可以...
2020-02-02 01:26:09
204
原创 数据无量纲化
数据无量纲化在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。譬如梯度和矩阵为核心的算法中,譬如逻辑回归,支持向量机,神经 网络,无量纲化可以加快求解速度;而在距离类模型,譬如K近邻,K-Means聚类中,无量纲化可以帮我们提升模型精度,避免某一个取值范围特别大的特征对距离计算造成影响。数据的无量纲化可以...
2020-02-01 15:37:27
3604
原创 数据挖掘与scikit-learn入门
数据探索所谓的数据探索就是对数据有一个初步的认知。比如业务背景是什么,特征是什么,特征的取值范围要不要约定,特征的维度,样本的维度等等。建议将数据利用pandas转换成dataframe,这样使用head()等方法可以很方便的查看数据信息。比如:#观察数据类型 data.head()#观察数据结构 data.shape() data.info()数据预处理去除重复值样本重复:...
2020-01-31 22:26:24
261
原创 逻辑回归与scikit-learn
欢迎关注本人的微信公众号AI_EngineLogisticRegression算法原理一句话概括:逻辑回归假设数据服从伯努利分布,通过极大化似然函数(损失函数)的方法,运用梯度下降或其他优化算法来求解参数,来达到将数据二分类的目的。定义:逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性(不是概率)。比如某用...
2020-01-27 15:37:20
464
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人