统计机器学习
文章平均质量分 58
三丰杂货铺
这个作者很懒,什么都没留下…
展开
-
安装pytorch的CUDA
文章目录安装pytorch的CUDA3.1 验证4 运行程序获取设备信息参考链接安装pytorch的CUDA根据pytorch的官网确定自己的安装命令是什么。创建一个conda的虚拟环境,卸载之前的torch。官网pip uninstall torch3.1 验证torch.cuda.is_available()返回False错误解决使用其中的脚本,或者调用cuda确认版本。在pycharm中切换为对应的pytorch环境版本。4 运行程序获取设备信息编写python代码获取原创 2021-07-17 16:01:25 · 298 阅读 · 0 评论 -
QBUS6810统计机器学习和数据挖掘
文章目录损失函数评估方法偏差方差分解no free lunch theorem损失函数针对训练集来说:回归 squared error loss:L(y,f(x))=(y−f(x))2L(y, f(\boldsymbol{x}))=(y-f(\boldsymbol{x}))^{2}L(y,f(x))=(y−f(x))2分类 0-1 loss:L(y,f(x))={1 if y≠f(x)0 if y=f(x).L(y, f(\boldsymbol{x}))原创 2021-06-07 20:17:53 · 361 阅读 · 0 评论 -
统计机器学习(四)决策树和集成ensemble
文章目录教程笔记概述本文阅读先决条件教程笔记概述来源于课程MA429,讲述统计机器学习。是算法工程师的基础。本文阅读先决条件阅读并尽可能理解intro naive bayes.pdf这个课件(本节课件充满大量笔记,建议结合西瓜书阅读)。本节课课件充斥大量笔记,建议直接看书。...原创 2021-05-20 19:20:02 · 156 阅读 · 0 评论 -
统计机器学习(四)评估方法
文章目录教程笔记概述本文阅读先决条件留出法(handout approach)k折交叉验证法k-fold cross-validation (CV)留一法(Leave-One-Out aka.LOO)自助法(Bootstrap)调参one standard error rule子集选择什么是子集选择?为什么要做子集选择?其他方法子集选择的方法Forward Stepwise SelectionBackward Stepwise SelectionFoward Stagewise Selection放缩法S原创 2021-05-20 16:37:23 · 299 阅读 · 0 评论 -
统计机器学习(三)KNN
教程笔记概述来源于课程MA429,讲述统计机器学习。是算法工程师的基础。本文阅读先决条件阅读并尽可能理解intro naive bayes.pdf这个课件。内容总结这个贝叶斯决策边界是实际的类别分类边界。还有我们设计的分类器的分类边界。k在10个左右时,偏差和方差比较小,mse综合较小。k过大时,mse也会增大。维度灾难,维度诅咒curse of dimensionality在高维出现的数据样本稀疏、距离计算困难,是所有机器学习面临的共同问题。本节推导:2维时,2类时,knn工作还行。维原创 2021-05-19 18:39:02 · 270 阅读 · 0 评论 -
统计机器学习(三)性能度量
文章目录教程笔记概述本文阅读先决条件内容总结MSE(mean square error)二分类任务的混淆矩阵Confusion matrixF1-score以及多分类的混淆矩阵Confusion matrix总结教程笔记概述来源于课程MA429,讲述统计机器学习。是算法工程师的基础。本文阅读先决条件阅读并尽可能理解intro naive bayes.pdf这个课件。内容总结MSE(mean square error)数理统计中均方误差是指参数估计值与参数值之差平方的期望值,记为MSE。MSE的原创 2021-05-19 11:47:03 · 709 阅读 · 1 评论 -
统计机器学习(二)朴素贝叶斯
文章目录教程笔记概述本文阅读先决条件内容总结基本公式离散属性要点连续属性要点Tip教程笔记概述来源于课程MA429,讲述统计机器学习。是算法工程师的基础。本文阅读先决条件阅读并尽可能理解intro naive bayes.pdf这个课件。内容总结基本公式贝叶斯定理:(A是类别,B是属性集合)P(A,B)=P(A)⋅P(B∣A)P(B)P(A,B) = \frac{P(A) \cdot P(B|A)}{P(B)} P(A,B)=P(B)P(A)⋅P(B∣A)朴素贝叶斯公式:P(A∣B)=原创 2021-05-17 23:04:25 · 173 阅读 · 0 评论 -
统计机器学习(一)基本概念
教程笔记概述来源于课程MA429,讲述统计机器学习。是算法工程师的基础。本文阅读先决条件阅读并尽可能理解intro naive bayes.pdf这个课件。内容总结KDDKnowledge Discovery in Databases(KDD)的五大阶段:数据选择(创造数据仓库,选择数据文件)数据预处理(去多余变量,去异常值,处理缺失值)转换(变量值转换为需要的格式)数据挖掘(机器学习部分)验证及解释(验证挖掘的规则,可解释性如何)学习分类监督学习无监督学习半监督学习(原创 2021-05-17 22:35:14 · 264 阅读 · 0 评论 -
统计机器学习-TODO
关联规则学习1关联规则学习2k-均值例子层次聚类例子log-loss解析原创 2021-05-30 21:46:44 · 118 阅读 · 1 评论 -
统计机器学习TODO
knn问题k要取奇数svm:首先看书。注意公式里的参数,不同地方的公式是不一样的。C=1λC = \frac{1}{\lambda}C=λ1C叫正则化系数或者惩罚因子,C越大,有越多的点越过间隔。对于径向核函数,可以表示测试点附近有点能够影响,γ=1σ\gamma = \frac{1}{\sigma}γ=σ1选择原则是,we should probably set o to be a few times the typical distance from a point to its n原创 2021-05-30 21:37:21 · 126 阅读 · 0 评论