自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 机器学习实战之 -- NaiveBayes

机器学习实战之 -- NaiveBayesNaiveBayes一、工作原理1.条件概率:2.朴素贝叶斯成立的条件概率假设:3.后验概率:3.朴素贝叶斯分类器:二、核心代码 NaiveBayes 一、工作原理 1.条件概率: P(X=x∣Y=ck)=P(X(1)=x(1),...,X(n)=x(n)∣Y=ck), k=1,2,3,...,K P(X=x|Y=c_...

2019-03-29 15:47:05 152

原创 集成学习实战之 -- RandomForest

集成学习实战之 -- RandomForest一、引入1.Linear modela.用线性模型拟合非线性数据:1)拟合较平滑的曲线2)拟合不规则曲线2.引入决策树a.两个问题1)决策树是线性模型吗?2)决策树能解决上面的问题吗?b.决策树的特点c.拟合数据二、模型融合1.Bagging2.Random Foresta.手动构建a.用sklearn中的模型构建 一、引入 1.Linear mode...

2019-03-29 10:51:40 253

原创 集成学习实战之 -- AdaBoost

机器学习实战之 -- AdaBoostAdaBoost一、AdaBoost简介二、工作原理1.错误率:2.弱分类器权重值:3.权重更新:4.最终分类器a.弱分类器的线性组合b.最终分类器三、核心代码1.基于单层决策树构建弱分类器3.基于单层决策树的AdaBoost训练4.测试算法:基于 AdaBoost的分类四、示例 AdaBoost 一、AdaBoost简介 AdaBoost采用的是boosti...

2019-03-29 01:53:05 230

原创 模型评估与模型选择

模型评估与模型选择一、损失函数和风险函数1.经验风险和结构风险2.经验风险最小化与结构风险最小化二、模型评估与模型选择1.最小二乘法2.过拟合代码实现3.模型选择a.正则化 一、损失函数和风险函数 损失函数:一次预测的好坏 风险函数:平均意义下模型预测的好坏 0-1损失函数 (0-1 loss function) L(Y,f(X))={1,Y≠f(X)0,Y=f(X)L(Y,f(X))= \be...

2019-03-10 05:55:27 341

原创 scikit-Learn demo

Scikit-Learn -- 实战一、大致流程1.Practice regressiona.LinearRegressionb.DecisionTree2.practice Classificationa.LogisticRegressionb.SVM二、Model selection1.Cross - Validation2.模型参数的选择三、underfit和overfit 一、大致流程 1...

2019-03-07 00:22:46 284

原创 python 应用之 -- 爬虫

python -- 爬虫 requests 获取页面内容,BeautifulSoop解析 requests 获取页面内容,BeautifulSoop解析 以爬取链家数据为例: import requests from bs4 import BeautifulSoup url = "https://bj.lianjia.com/zufang/" headers = {'User-Agent' :...

2019-02-21 23:58:58 203

原创 机器学习实战 -- 决策树

机器学习实战 -- 决策树决策树一、决策树算法简介二、工作原理经验熵(empirical entropy)经验条件熵(empirical conditional entropy):信息增益(information gain):三、核心代码1.创建数据集2.计算数据集的经验熵3.划分数据集a. 按照指定的特征划分数据集b. 选择最好的特征划分数据集4.递归构建决策树5.绘制树形图a. 使用文本注解绘...

2018-12-23 01:09:58 181

原创 机器学习实战之 -- kNN

机器学习实战之 -- kNNk-近邻算法一、工作原理二、代码实现1.创建样本数据集和标签2.利用kNN算法返回频率最高的元素标签三、示例1.准备数据:从文本中解析数据,输出训练样本矩阵和类标签向量。2.分析数据:使用Matplotlib绘制散点图3.归一化数值4.测试算法5.使用算法 k-近邻算法 Lp(xi,xj)=(∑l=1n∣xi(l)−xj(l)∣p)1/pL_p(x_i,x_j) = (...

2018-12-22 00:13:53 170

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除