自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 特征工程与scikit-learn

欢迎关注我的公众号:AI_Engine。知乎,简书同名呦~今日头条搜索:极意就是在下啦!欢迎转发,评论噢!Filter过滤法过滤法通常在预处理阶段使用,特征选择完全独立于任何算法之外。方差过滤 **本质:** 使用特征本身的方差来消除方差小于阈值的特征。 **API:** VarianceThreshold **实例:**import pandas a...

2020-02-16 04:19:29 135

原创 数据挖掘与scikit-learn浅出

数据无量纲化在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。譬如梯度和矩阵为核心的算法中,譬如逻辑回归,支持向量机,神经 网络,无量纲化可以加快求解速度;而在距离类模型,譬如K近邻,K-Means聚类中,无量纲化可以帮我们提升模型精度,避免某一个取值范围特别大的特征对距离计算造成影响。数据的无量纲化可以...

2020-02-02 01:26:09 204

原创 数据无量纲化

数据无量纲化在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。譬如梯度和矩阵为核心的算法中,譬如逻辑回归,支持向量机,神经 网络,无量纲化可以加快求解速度;而在距离类模型,譬如K近邻,K-Means聚类中,无量纲化可以帮我们提升模型精度,避免某一个取值范围特别大的特征对距离计算造成影响。数据的无量纲化可以...

2020-02-01 15:37:27 3604

原创 数据挖掘与scikit-learn入门

数据探索所谓的数据探索就是对数据有一个初步的认知。比如业务背景是什么,特征是什么,特征的取值范围要不要约定,特征的维度,样本的维度等等。建议将数据利用pandas转换成dataframe,这样使用head()等方法可以很方便的查看数据信息。比如:#观察数据类型 data.head()#观察数据结构 data.shape() data.info()数据预处理去除重复值样本重复:...

2020-01-31 22:26:24 261

原创 逻辑回归与scikit-learn

欢迎关注本人的微信公众号AI_EngineLogisticRegression算法原理一句话概括:逻辑回归假设数据服从伯努利分布,通过极大化似然函数(损失函数)的方法,运用梯度下降或其他优化算法来求解参数,来达到将数据二分类的目的。定义:逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性(不是概率)。比如某用...

2020-01-27 15:37:20 464

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除