![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
读书笔记
Jeremy Liang
这个作者很懒,什么都没留下…
展开
-
机器学习算法笔记--------K-近邻算法
基本思想: 假设训练集中每个数据都是已标记的数据。 当输入一个新样本的时候,将新样本的特征和数据集中的数据进行特征比对。 找出最相似的前k个数据。(欧式距离-L2范数,闵科夫斯基距离-Lp范数) 统计这k个数据的标签,其中出现频率最高的一个标签,就是我们的预测结果。(多数表决) 优缺点: 优点:精度高 缺点:计算复杂度高,空间复杂度高。没有显...原创 2018-11-21 10:07:18 · 172 阅读 · 0 评论 -
李航 统计学习方法 第一章 习题 参考答案
1.1 说明伯努利模型的极大似然估计以及被压死估计中的统计学习方法三要素。统计学习三要素:模型、策略和算法。伯努利模型的极大似然估计 模型 策略 算法 极大似然估计 条件概率 经验风险最小化 求解析解 贝叶斯估计 条件概率 结构风险最小化 求数值解 伯努利模型是定义在取值为0和1的随机变量上的概率分布。极大似...原创 2019-03-01 13:49:15 · 1146 阅读 · 0 评论 -
算法分析--回溯法
回溯法提高搜索速度的策略:用约束函数在扩展节点处剪去不满足约束的子树。 用限界函数减去得不到最优解的子树。原创 2018-12-06 15:36:52 · 288 阅读 · 0 评论 -
算法分析--贪心算法--最小生成树
贪心算法贪心算法做的选择都是当前状态下的局部最好选择。每次选择都将问题简化为规模更小的子问题。优点:简单高效。缺点:不是对所有问题都能找到整体最优解。最小生成树问题 ...原创 2018-12-06 12:33:42 · 1053 阅读 · 0 评论 -
程序猿必备技能包--学习资料汇总
Git,Github廖雪峰的Git教程:https://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000原创 2018-12-13 09:33:23 · 183 阅读 · 0 评论 -
算法分析--动态规划--矩阵连乘
动态规划算法的基本要素:最优子结构性质假设A1*A2*A3*...*An在k处断开为最优,那么只需要保证A1*...*Ak和Ak*..*An两个子序列的分割也是最优,就能保证该结果是最优。子问题重叠性问题描述:对于多个矩阵连乘,不同的分割次序会导致计算次数的不同,所以要找到最优化的分割,减少计算量。 A1 A2 A3 A4 A5 A6 ...原创 2018-12-06 09:45:34 · 641 阅读 · 0 评论 -
机器学习算法笔记--------朴素贝叶斯
拉普拉斯平滑 保证不会出现0概率,每个概率都是0-1,概率总和为1 似然度,置信度 先验概率,后验概率 先验概率:P(X) ,P(Y)后验概率:P(X|Y) ,P(Y|X)贝叶斯公式: 例子(通过简单例子理解朴素贝叶斯的基本思想) 例一:癌症检测结果分析目标:根据先验概率P(Y)(患病和无患病的比例)和后验概率P(X|Y)(患病同时被检测出患病...原创 2018-11-29 17:43:42 · 262 阅读 · 0 评论 -
机器学习算法笔记--------决策树
摘要决策树包含三个主要过程:特征选择,决策树生成,决策树剪枝。其核心思想是计算集合无序程度,主要算法有ID3,C4.5和CART背景知识信息熵假设变量X的可能取值为Xi,i=1,2,……,n。变量X取值为Xi的概率为:那么随机变量X的信息熵为:条件熵变量Y在给定条件X下的信息熵:信息增益定义:特征A对训练数据集D的信息增益,g(D,A), 定义为集合D...原创 2018-11-27 14:54:21 · 390 阅读 · 0 评论 -
算法分析--递归与分治--快速排序
快速排序算法策略分解:选择数组a中的一个元素q作为基准,把数组划分为三段a1<q,a2=q和a3>q。 递归:对数组a1,a2递归调用快速排序算法。 合并:不需要额外操作快速排序法时间复杂度分析1、最优情况每次都刚好在中间。解递归方程得:2、最坏情况解递归方程得:3、平均情况算法图解第一步:1、选择第一个元素41作为...原创 2018-11-01 13:44:55 · 485 阅读 · 0 评论 -
统计学习、机器学习的基础知识汇总
数学概念 偏序关系 互信息 F1值,精确率,召回率 TP(True Positive) -- 将正类预测为正类FN(False Negative) --将负类预测为负类FP(False Positive) --将负类预测为正类TN(True Negative) --将正类预测为负类精确率(我预测了100个样本是对的,但实际上只有99个是真的对的,R=9...原创 2018-11-28 16:03:55 · 515 阅读 · 0 评论 -
机器学习算法笔记--------建立西瓜数据集
西瓜书里面常用的三个数据集,西瓜数据集2.0,3.0,4.0整理如下,注意中文容易出现乱码。西瓜数据集2.0西瓜数据集3.0西瓜数据集4.0 import pandas as pddef createDataSet_2(): dataSet_2 = [ # 1 ['青绿', '蜷缩', '浊响', '清晰', '凹陷',...原创 2018-12-04 10:04:01 · 6650 阅读 · 2 评论