机器学习
逝不等琴生
你必须暗自努力,才能显得轻松如意
展开
-
机器学习入门笔记(一)
前言仅供记录一下个人的学习笔记,不当之处还请指正正文人工智能、机器学习、深度学习三者之间的关系(如下图):机器学习是人工智能的一个实现途径深度学习是机器学习的一个方法发展而来数据集介绍数据集中的一行数据一般称为一个样本,一列数据一般称为一个特征数据集的构成由特征值+目标值(部分数据集没有目标值)构成为了模型的训练和测试,一般都会把数据集分为训练数据(70%-80%)和测试...原创 2020-04-01 23:20:54 · 597 阅读 · 8 评论 -
Spark——RDD是什么?
Spark 中最基本的数据抽象是 RDD。RDD:弹性分布式数据集 (Resilient Distributed DataSet)。1,RDD 有三个基本特性这三个特性分别为:分区,不可变,并行操作。a, 分区每一个 RDD 包含的数据被存储在系统的不同节点上。逻辑上我们可以将 RDD 理解成一个大的数组,数组中的每个元素就代表一个分区 (Partition) 。在物理存储中,每个分区...转载 2019-12-10 17:05:03 · 586 阅读 · 0 评论 -
深度学习—过拟合问题
1、过拟合问题 欠拟合:根本原因是特征维度过少,模型过于简单,导致拟合的函数无法满足训练集,误差较大; 解决方法:增加特征维度,增加训练数据; 过拟合:根本原因是特征维度过多,模型假设过于复杂,参数过多,训练数据过少,噪声过多,导致拟合的函数完美的预测训练集,但对新数据的测试集预测结果差。 过度的拟合了训练数据,而没有考虑到泛化能力。 ...转载 2019-12-10 16:30:22 · 301 阅读 · 0 评论 -
推荐系统评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure)
下面简单列举几种常用的推荐系统评测指标:1、准确率与召回率(Precision & Recall)准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。准确率(也称精度)是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率;召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。一般来说,Pre...转载 2019-12-04 23:38:52 · 343 阅读 · 0 评论