![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
读书笔记
文章平均质量分 53
主要以读书摘要为主
大白羊_Aries
这个作者很懒,什么都没留下…
展开
-
《现代 C++ 教程》笔记——面向现代 C++
被弃用的特性〼不再允许字符串字面值常量赋值给一个 char *(讲真,这一点真的很常用)如果需要使用字符串字面值常量赋值和初始化一个 char *,应该使用 const char* 或 auto〼C++98、unexpected__handler、 set_unexpected() 等相关特性被弃用,转而使用noexcept〼auto_ptr 被弃用,应使用 unique_ptr〼 register 关键字被弃用,可以使用但不再具备任何实际含义〼 bool 类型的 ++ 操作被弃〼 如果一个原创 2021-05-27 20:06:25 · 169 阅读 · 0 评论 -
《统计推断第二版》笔记——区间估计
区间估计9.1 引言9.1 引言前面讨论过参数θ\thetaθ的点估计,那里的推断是猜测一个单个值作为θ\thetaθ的值,这一章我们讨论区间估计及更一般的集合估计。集合估计问题中的推断就是陈述 θ∈C\theta\in Cθ∈C,其中C⊂ΘC\subset\ThetaC⊂Θ并且C=C(X)C=C(\mathbf X)C=C(X)是一个由观测数据X=x\mathbf X=\mathbf xX...原创 2020-04-15 10:15:49 · 390 阅读 · 0 评论 -
《统计推断第二版》笔记——假设检验
8.2.2 Bayes检验在一个建设检验问题中,后验分布可以用来计算H0H_0H0和H1H_1H1为真的概率。记住,π(θ∣x)\pi (\theta| \mathbf x)π(θ∣x)是一个关于随机变量的概率分布。因此,后验概率P(θ∈Θ0∣x)=P(H0为真∣x)P(\theta \in \Theta_0|\mathbf x) = P(H_0为真|\mathbf x)P(θ∈Θ0∣x)...原创 2020-04-05 10:13:58 · 1381 阅读 · 0 评论 -
《统计学习方法》笔记——PCA(未完待更)
16 主成分分析16.1 总体主成分分析16.1.1 基本想法16.1.2 定义和导出16.1.3 主要性质16.1 总体主成分分析16.1.1 基本想法数据的变量之间可能存在相关性,以致增加了分析的难度。于是,考虑由少数不相关的变量来代替相关的变量,用来表示数据,并且要求能够保留数据中的大部分信息主成分分析中,首先对给定数据进行规范化,使得数据每一变量的平均值为0,方差为1之后,对...原创 2020-03-21 17:47:05 · 467 阅读 · 0 评论 -
《数据挖掘(完整版)》笔记——K均值
聚类分析1. 不同的聚类类型2. 不同的簇类型3. K-means3.1 基本K均值算法1. 不同的聚类类型层次的与划分的划分聚类简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中。如果允许簇具有子簇,则得到一个层次聚类。层次聚类是嵌套簇的集族,组织成一棵树。除叶结点外,树中每一个结点(簇)都是其子女(子簇)的并,而树根是包含所有对象的簇。互斥的、重叠的与模糊的在最一般...原创 2020-03-10 11:45:58 · 1286 阅读 · 0 评论 -
《数据挖掘(完整版)》笔记——组合方法
组合方法1. 组合方法的基本原理2. 构建组合分类器的方法1. 组合方法的基本原理考虑如下的例子再看下面一张图对角线表示所有基分类器都是等同的情况,则实线表示所有基分类器独立时的情况通过这两个例子说明,组合分类器的性能优于单个分类器必须满足两个必要的条件:基分类器之间应该相互独立基分类器应当好于随机猜测分类器实践上,很难保证基分类器之间完全独立,尽管如此,我们看到在基分类器...原创 2020-03-09 21:52:19 · 1073 阅读 · 0 评论 -
《数据挖掘(完整版)》笔记——支持向量机
支持向量机1. 最大边缘超平面2. Mercer定理1. 最大边缘超平面具有较大边缘的决策边界比那些具有较小边缘的决策边界具有更好的泛化误差。直觉上,如果边缘比较小,决策边界任何轻微的扰动都可能对分类产生显著的影响,因此,那些决策边界边缘较小的分类器对模型的过拟合更加敏感,从而在位置的样本上的泛化能力很差统计学习理论给出了线性分类器边缘与其泛化误差之间关系的形式化解释,我们称这种理论为结构风...原创 2020-03-05 11:45:47 · 352 阅读 · 1 评论 -
《数据挖掘(完整版)》笔记——人工神经网络
人工神经网络1. 感知机1. 感知机感知器模型的输出可以用如下数学方式表示:y^=sign(wdxd+wd−1xd−1+⋯+w2x2+w1x1−t)=sign(wdxd+wd−1xd−1+⋯+w2x2+w1x1+w0x0)=sign(w⋅x)\hat y = sign(w_dx_d+w_{d-1}x_{d-1}+\cdots+w_2x_2+w_1x_1-t)=sign(w_dx_d+w_{d...原创 2020-03-04 13:16:37 · 748 阅读 · 0 评论 -
《数据挖掘(完整版)》笔记——贝叶斯分类器
贝叶斯分类器1. 贝叶斯定理在分类中的应用2. 朴素贝叶斯分类器1. 贝叶斯定理在分类中的应用P(Y∣X)=P(X∣Y)P(Y)/P(X)P(Y | \mathbf X)= P(\mathbf X|Y)P(Y)/P(\mathbf X)P(Y∣X)=P(X∣Y)P(Y)/P(X)在比较不同YYY值的后验概率时,P(X)P(\mathbf X)P(X)是常数,先验概率P(Y)P(Y)P(Y)可...原创 2020-03-02 11:21:32 · 701 阅读 · 0 评论 -
《数据挖掘(完整版)》笔记——最近邻分类器
最近邻分类器1. 算法2. 最近邻分类器的特征决策树和基于规则的分类器是积极学习方法的例子,因为如果训练数据可用,衙门就开始学习从输入属性到类标号的映射模型。与之相反的策略是推迟对训练数据的建模,知道需要分类测试样例时再进行,采用这种策略的技术被称为消极学习方法消极学习方法的一个例子是Rote分类器,它记住整个训练数据,仅当测试实例的属性和某个训练样例完全匹配才进行分类使用该方法更灵活的一个...原创 2020-03-02 10:40:06 · 1122 阅读 · 0 评论 -
机器学习、深度学习 面经(未完待更)
Q1. 交叉熵公式交叉熵主要用于度量两个概率分布间的差异性信息。将交叉熵引入计算语言学消岐领域,采用语句的真实语义作为交叉熵的训练集的先验信息,将机器翻译的语义作为测试集后验信息。计算两者的交叉熵,并以交叉熵指导对歧义的辨识和消除。在信息论中,交叉熵是表示两个概率分布p,q,其中p表示真实分布,q表示非真实分布,在相同的一组事件中,其中,用非真实分布q来表示某个事件发生所需要的平均比特数。从...原创 2020-03-19 16:53:23 · 570 阅读 · 0 评论 -
《数据挖掘(完整版)》笔记——基于规则的分类器
规则分类器1. 基于规则的分类器1.1 工作原理1. 基于规则的分类器基于规则的分类器是使用一组 “if…then” 规则来对记录进行分类的技术。该模型的规则用析取范式 R=(r1∨r2∨⋯∨rk)R = (r_1\vee r_2 \vee \cdots \vee r_k)R=(r1∨r2∨⋯∨rk),其中RRR称作规则集,而rir_iri是分类规则或析取项每一个分类规则可以表示为如...原创 2020-02-27 12:16:38 · 2890 阅读 · 0 评论 -
《数据挖掘(完整版)》笔记 - 决策树
决策树归纳的特点决策树归纳是一种构建分类模型的非参数方法,换句话说,它不要求任何先验假设,不假定类和其他属性服从一定的概率分布找到最佳的决策树是NP完全问题,许多决策树算法都采用启发式的方法指导对假设空间的搜索已开发的构建决策树技术不需要昂贵的计算代价,即使训练集非常大,也可以快速建立模型。决策树一旦建立,未知样本样本分类非常快,最坏情况下的时间复杂度为O(w)O(w)O(w),其中www...原创 2020-02-24 12:27:19 · 1168 阅读 · 0 评论