自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

醒途

从零到一,感谢自己

  • 博客(9)
  • 收藏
  • 关注

原创 kaggle实战之竞赛步骤

特征使用方案基于业务理解,尽可能找出对因变量有影响的所有自变量并根据获取难度、覆盖率、准确率对特征进行可用性评估特征获取如何获取这些特征如何存储特征清洗清洗异常特征进行采样,如果数据不均衡,可以使用上采样或下采样保证数据均衡将少的数据给予大的权重,以模型能够着重考虑少的数据把多数据分为多类与少数据组成多组数据均衡的数据,分别训练多个弱分类器,然后...

2018-12-04 23:34:14 334

原创 EM算法

https://blog.csdn.net/zouxy09/article/details/8537620

2018-12-03 19:25:27 164

转载 最大似然估计

假设我们需要调查我们学校的男生和女生的身高分布。你怎么做啊?你说那么多人不可能一个一个去问吧,肯定是抽样了。假设你在校园里随便地活捉了100个男生和100个女生。他们共200个人(也就是200个身高的样本数据,为了方便表示,下面,我说“人”的意思就是对应的身高)都在教室里面了。那下一步怎么办啊?你开始喊:“男的左边,女的右边,其他的站中间!”。然后你就先统计抽样得到的100个男生的身高。假设他们的...

2018-12-03 19:21:28 358

原创 [Python-代码实现]统计学习方法之感知机模型

通过鸢尾花数据对感知机模型进行训练及展示手写 Codingimport pandas as pdimport numpy as npfrom sklearn.datasets import load_irisimport matplotlib.pyplot as plt# 五、构建训练模型class Model: def __init__(self, data): ...

2018-12-03 13:28:01 218

原创 深度学习实践(一)—tensorflow之概述

内容预览1.1 深度学习与机器学习的区别1.1.1 特征提取方面1.1.2 数据量和计算性能要求1.1.3 算法代表1.2 深度学习的应用场景1.2.1 图像识别1.2.2 自然语言处理技术1.2.3 语音技术1.3 深度学习框架介绍1.3.1 常见深度学习框架对比1.3.2 TensorFlow的特点1.3.3 TensorFlow的安装1....

2018-12-02 16:57:07 437

原创 机器学习实践(十七)—sklearn之无监督学习-K-means算法

一、无监督学习概述什么是无监督学习之所以称为无监督,是因为模型学习是从无标签的数据开始学习的。无监督学习包含算法聚类K-means(K均值聚类)降维PCA二、K-means原理K-means聚类步骤随机设置K个特征空间内的点作为初始的聚类中心对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚类中心点作为标记类别接着对着标记的聚类中...

2018-12-01 23:13:09 724

原创 机器学习实践(十六)—sklearn之模型保存和加载

一、sklearn - 模型的保存和加载 - APIfrom sklearn.externals import joblib保存joblib.dump(rf, ‘test.pkl’)加载estimator = joblib.load(‘test.pkl’)二、示例助解保存# 使用线性模型进行预测# 使用正规方程求解lr = LinearRegression...

2018-12-01 23:10:56 801 2

原创 机器学习实践(十五)—sklearn之分类算法-逻辑回归、精确率、召回率、ROC、AUC

逻辑回归虽然名字中带有回归两字,但它实际是一个分类算法。一、逻辑回归的应用场景广告点击率是否为垃圾邮件是否患病金融诈骗虚假账号看到上面的例子,我们可以发现其中的特点,那就是都属于两个类别之间的判断。逻辑回归就是解决二分类问题的利器二、逻辑回归的原理输入逻辑回归的输入其实就是线性回归即:hθ(x)=θTxh_\theta(x)=\theta^Txhθ​(x)=...

2018-12-01 23:09:53 6550

原创 机器学习实践(十四)—sklearn之岭回归(线性回归的改进)

带有 L2 正则化的线性回归就是岭回归。岭回归,其实也是一种线性回归。只不过在算法建立回归方程时候,加上正则化的限制,从而达到解决过拟合的效果。加上正则化,也就是使权重满足划分正确结果的同时尽量的小一、岭回归 - API岭回归 - APIsklearn.linear_model.Ridge(alpha=1.0, fit_intercept=True,solver=“auto”, ...

2018-12-01 23:07:31 702

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除