机器学习
popo-shuyaosong
这个作者很懒,什么都没留下…
展开
-
第5章:前4章综合运用_案例实战04泰坦尼克号获救分析
第5章:案例实战04泰坦尼克号获救分析1 其他参考2 读取数据3 数据预处理3.1 填充缺失值3.2 字符型变量变为数字4 使用回归算法进行预测4.1 线性回归4.2 逻辑回归5 使用随机森林改进模型5.1 调参5.2 新增特征5.3 正则表达式搜索title6 特征重要性分析7 集成算法1 其他参考2 读取数据3 数据预处理3.1 填充缺失值3.2 字符型变量变为数字4 使用回...原创 2019-10-24 22:07:47 · 426 阅读 · 0 评论 -
第4.3章:决策树(decision tree)_案例实战03决策树调包示例
第4.3章:决策树(decision tree)_案例实战03决策树调包示例1 导入数据集1.1 查看数据1.2划分数据集2 树模型参数3 决策树可视化3.1 模型训练3.2 可视化4 随机森林5 自动调参1 导入数据集1.1 查看数据1.2划分数据集2 树模型参数3 决策树可视化3.1 模型训练3.2 可视化4 随机森林5 自动调参...原创 2019-10-24 21:37:28 · 706 阅读 · 0 评论 -
第3章:过拟合(over-fitting)与正则化(regularization)
对于一组数据集,如果我们得到了两个模型A和B,他们的精度和召回率都是相同的。而A模型中参数θ\thetaθ的波动范围比较大,B模型的θ\thetaθ波动范围比较小,那么我们倾向于选用B模型。因为参数波动大的话,可能是过拟合的一种表现,即在训练集中表现好而测试集表现差,也就是泛化能力差为了得到B模型,于是引入正则化,又分为L1正则化和L2正则化。L1正则化是给目标函数+C⋅∣θ∣C \cdot|...原创 2019-08-24 11:19:32 · 421 阅读 · 0 评论 -
第2.3章:逻辑回归(Logistic Regression)_案例实战02异常交易检测
第2.3章:逻辑回归_样本不均衡问题1.模型评估方法2.导入数据2.1数据预处理3.解决样本不均衡问题3.1 欠采样3.2 交叉验证与正则化3.2.1 划分train、test3.2.2 lambda与recall值3.3 混淆矩阵3.3.1 定义画图函数3.3.2 欠采样的混淆矩阵3.3.3 原数据的混淆矩阵3.4 逻辑回归的阈值3.5 不均衡数据建模3.6 过采样3.6.1 求lambda与r...原创 2019-08-27 22:43:27 · 1199 阅读 · 0 评论 -
第2.2章:逻辑回归(Logistic Regression)_案例实战01能否录取
第2章:逻辑回归_案例实战导入样本数据导入样本数据原创 2019-08-19 10:19:16 · 388 阅读 · 4 评论 -
第2.1章:逻辑回归(Logistic Regression)_原理推导&参数求解&模型评估
第2章:逻辑回归来源本章视频一、逻辑回归算法原理推导1.概述2.引入sigmoid函数3.假设函数4.似然函数5.目标函数来源Lecture_02本章视频03_数据分析处理库-Pandas、04_数据可视化库-Matplotlib、08_逻辑回归算法、09_案例实战:Python实现逻辑回归与梯度下降策略一、逻辑回归算法原理推导1.概述逻辑回归是一个经典的二分类算法,属于分类问题。...原创 2019-08-11 18:41:00 · 626 阅读 · 0 评论 -
第1.3章:线性回归(Linear Regression)_模型评估
转自:大话线性回归(二)、大话线性回归(三)本文为待加深学习内容,在此仅列举了框架,详细技术参考上面两篇来源简述一下流程:先搭建一个线性回归模型,运用梯度下降或者正规方程法可以求出参数,这样模型就确定了。之后再用一些检测方法,评估模型是否合理并进行优化。文中y^\hat{y}y^为预测值,y(i)y^{(i)}y(i)为实际值,xix_{i}xi表示第iii个变量(特征),x(...原创 2019-08-07 11:18:59 · 1720 阅读 · 0 评论 -
第1.2章:线性回归(Linear Regression)_参数的求解
第1.2章:线性回归参数的求解来源本章视频视频06:线性回归算法原理推导视频07:线性回归参数的求解(求函数最小值)1.正规方程法2.梯度下降法梯度下降背后的思想梯度下降的迭代方法1.代数法2.矩阵法3.几点补充梯度下降的参数选取1.初始参数2.学习率(步长)3.特征缩放4.终止条件5.其他模型转化为线性模型3.梯度下降法家族批量梯度下降随机梯度下降小批量梯度下降文中xix_{i}xi表示第...原创 2019-07-14 11:22:10 · 3159 阅读 · 0 评论 -
第1.1章:线性回归(Linear Regression)_算法原理推导
第1章:线性回归来源本章视频视频06:线性回归算法原理推导1、概述关于回归问题与分类问题关于假设函数(预测函数)2、误差项分析误差高斯分布(正态分布)3、似然函数求解来源Lecture_01本章视频06、07视频06:线性回归算法原理推导1、概述关于回归问题与分类问题举一个银行贷款的例子:给定几组数据(年龄,工资,贷款额度)做为样本,当再次给一组数据(年龄,工资)时,预测出贷款额度...原创 2019-07-11 22:58:00 · 537 阅读 · 0 评论 -
第0章:机器学习基础知识
来源:Lecture_00系统选择。先使用windows,等到后面再考虑学习linux。笔记整理工具。Markdown。Markdown 语法手册 (较全、不过不详细)Markdown 语法图文全面详解Markdown 常用语法—标题、字体、引用、分割线、图片、链接、列表、表格、代码、流程图。补:关于插入本地图片LaTeX数学公式编辑。Latex公式指导手册...原创 2019-04-17 14:20:15 · 405 阅读 · 0 评论 -
GitHub的使用(持续更新)
1、GitHub注册:猎豹浏览器不支持注册,要用IE浏览器。2、关于GitHub的——fork。fork并且更新一个仓库:fork他的仓库(复制到自己的github)—→ clone到本地计算机 —→ 更新仓库文件 —→ 将更改push到GitHub仓库 —→ 可以给对方发一个pull requet,对方自由选择是否接受(纳入他的仓库) 同步一个fork:从对方仓库获取最新文...原创 2019-04-10 18:24:22 · 116 阅读 · 0 评论 -
第4.1章:决策树(decision tree)_特征选择&决策树生成
第4章:决策树决策树概述决策树概述决策树属于非线性模型,可以用于分类,也可用于回归。它是一种树形结构,可以认为是if-then规则的集合,是以实例为基础的归纳学习。基本思想是自顶向下,以信息增益(或信息增益比,基尼系数等)为度量构建一颗度量标准下降最快的树,每个内部节点代表对一个属性的测试(判断),直到叶子节点处只剩下同一类别的样本。决策树组成:重要程度高的做根节点,或者说根节点的效果会...原创 2019-09-11 16:15:17 · 2602 阅读 · 0 评论 -
第4.2章:决策树(decision tree)_决策树的剪枝&优缺点
第4.2章:决策树_决策树剪枝三、决策树剪枝预剪枝后剪枝预剪枝与后剪枝对比四、CART算法&决策树优缺点三、决策树剪枝决策树如果将全部特征都用上,可能会有过拟合的风险,因为如果没有任何限制,在生成的阶段,它将会穷尽所有的特征,直到停止条件。这时叶子节点的数目最多,而叶子节点越多则越容易发生过拟合缺少泛化能力。因此需要对决策树剪枝,剪枝策略主要有预剪枝(pre-pruning)和后剪枝(...原创 2019-09-13 15:27:15 · 3267 阅读 · 0 评论