花书
文章平均质量分 74
巧克力酱人
Hello World
展开
-
【花书】chapter5:机器学习基础
5.1 学习算法机器学习算法是一种能够从数据中学习的算法。“学习”的一个定义:对于某类任务T和性能度量P,一个计算机程序被认为可以从经验E中学习是指,通过经验E改进后,它在任务T上由性能度量P衡量的性能有所提升。5.1.1 任务T机器学习的任务通常定义为机器学习系统应该如何处理样本。样本是指从某些机器学习系统处理的对象或事件中收集到的已量化的特征的集合。通常会将样本表示成一个向量x∈Rnx\in \mathbb R^nx∈Rn,其中向量的每一个元素xix_ixi是一个特征。例如一张图片的特征原创 2021-02-25 16:19:05 · 174 阅读 · 0 评论 -
【花书】chapter4:数值计算
4.1 上溢和下溢在计算机中表示实数时,几乎总会引入一些误差。下溢是一种舍入误差,当接近0的数被四舍五入为0时发生下溢。上溢是一种极具破坏力的数值错误形式,当大量级的数被近似为∞或−∞\infty或-\infty∞或−∞时发生上溢。进一步的运算会使这些无限值变为数字。必须对上溢和下溢进行数值稳定的一个例子是softmax函数:softmax(x)i=exp(xi)∑j=1nexp(xj)softmax(x)_i = \frac{\exp(x_i)}{\sum_{j=1}^n\exp(x_j)原创 2021-02-24 15:21:10 · 152 阅读 · 0 评论 -
【花书】chapter3:概率与信息论
概率论使我们能够提出不确定的声明以及在不确定性存在的情况下进行推理。信息论使我们能够量化概率分布中的不确定性总量。3.1 为什么要使用概率机器学习通常必须处理不确定量,有时也可能处理随机(非确定性的)量。不确定性和随机性来自多个方面。不确定性有三种可能的来源:1. 被建模系统内在的随机性。比如玩扑克,假设扑克牌被混洗成了随即顺序。2. 不完全观测。加入在两个黑袋子中选一个,选择的人是不知道黑袋子中都有什么的,因此对于人来说结果是不确定的。3. 不完全建模。当我们使用一些必须舍弃某些观测信.原创 2021-02-23 11:28:34 · 110 阅读 · 0 评论 -
【花书】chapter2:线性代数
2.1标量、向量、矩阵和张量标量:一个标量就是一个数,一般用斜体表示标量,标量通常被赋予小写的变量名称。介绍标量的时候,通常会明确表示标量的类型。比如“令s∈Rs\in\mathbb Rs∈R表示一条线的斜率。向量:一个向量是有序排列的一列数,通过次序中的索引可以确定每个单独的数。通常向量的名称是粗体小写表示,比如x\bold{x}x .可以把向量看作一个n维空间上的点,每个元素是不同坐标轴上的坐标。x=[x1x2x3...xn]x−1={x∣x∈x,x≠x1}S=1,3,6x−S={x∣x∈x,x原创 2021-02-20 22:39:14 · 149 阅读 · 0 评论 -
【花书】chapter1:引言
机器学习:可以看作是一种AI系统从原始数据中提取模式的能力。简单的机器学习算法的性能在很大程度上依赖数据的表示,也就是说需要从对象中提取和结果有关联的尽可能有效的特征。但是特征的选取不太容易,例如我们要提取图片中的车。可以认为是否存在轮子作为车的特征,但是如果轮子被挡住了呢,这就不是车了吗。因此要考虑更好的选取特征的方式。表示学习:为了更好地提取特征,可以使用机器学习来发掘表示本身,而不仅仅把表示映射到输出。这种方式就是表示学习。也就是说原来我们自己提取特征,根据不同特征和结果的关联来提取更有效的特征.原创 2021-02-19 15:27:34 · 100 阅读 · 0 评论