![](https://img-blog.csdnimg.cn/20190927151132530.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
算法模型 - 基础篇
文章平均质量分 90
算法模型 - 基础篇
文晓武
专注搜索推荐问答推荐工程领域,涉及到的技术有:Java、ElasticSearch、SpringBoot、SpringCloud、Dubbo、Linux、Docker、Sql、Kafka、RabbitMQ、RocketMQ、MyBatis、XXl-Job、Zookeeper、Nginx、Redis、Tomcat、Git、SVN、Maven、K8S等,每周不定期更新精华文章!
展开
-
如何理解归一化(normalization)?
在机器学习领域中,不同评价指标(即特征向量中的不同特征就是所述的不同评价指标)往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。其中,最典型的就是数据的归一化处理。简而言之,归一化的目的就是使得预处理的数据被限定在一定的范围内(比如[0,1]或者[-1,1]),从而消除奇异样本数据导致的不良影响。奇异样本数据是指相对于其他输入样本特别大或特别转载 2022-06-15 11:37:49 · 9563 阅读 · 1 评论 -
向量究竟是什么?
第一章的开始,作者分别用三种不同的角度解释了线性代数中最基础、最根源的组成部分——向量(Vector)。角度一:物理专业的学生向量是空间中的箭头,决定一个向量的是它的长度和它所指的方向。处在平面的向量是二维的,处在我们生活的空间的向量是三维的。角度二:计算机专业的学生向量是有序的数学列表。作者在视频中给出了房子的例子,例子中有两个维度分别是面积和价格,之所以是有序因为它们的顺序不可变换,否则失去意义。角度三:数学家只要保证两个向量相加以及数字和向量相乘是有意义的即可。作者转载 2022-04-02 05:06:06 · 1464 阅读 · 0 评论 -
机器学习的30个基本概念,都在这里了(手绘图解)
作者:梅子行、毛鑫宇来源:大数据DT(ID:hzdashuju)01空间表征在学习深奥的机器学习理论之前,首先来介绍一些机器学习中最基本的概念。 特征(Feature):一个具体事物的属性描述,由属性向量表示。第j个记录xj的属性向量可以表示为: xj=(xj(1),xj(2),…,xj(i),…,xj(n)), j=1,2,…,N, xj∈X 其中每个xj(i)为一个特征维度上的取值。 标记(Label):又称样本标签,用于描述事物某个特性的事项。 标记.转载 2022-04-02 04:52:22 · 1318 阅读 · 0 评论 -
机器学习三要素之数据、模型、算法
机器学习三要素包括数据、模型、算法。简单来说,这三要素之间的关系,可以用下面这幅图来表示:总结成一句话:算法通过在数据上进行运算产生模型。下面我们先分别来看三个要素。1. 数据关于数据,其实我们之前已经给出了例子。源数据上一篇中,图1老鼠和其他动物和图2小马宝莉六女主就是现实中的两份样本集合。如果我们要训练“老鼠分类器”,或者做“小马种族聚类” 分析的话,它们就是原始数据(Raw Data)。不过,我们之前也说了,计算机能够处理的是数值,而不是图片或者文字。向量空间模型和转载 2022-04-02 04:47:59 · 3801 阅读 · 0 评论