机器学习
文章平均质量分 70
饭饭童鞋
菜鸟一个,若有问题,请多包涵
展开
-
机器学习--混淆矩阵
1.模型优缺点比较:2.信息熵:信息熵是信息的期望值,描述信息的不确定度。一个系统越是有序,信息熵就越低;反之,一个系统越是混乱,它的信息熵就越高。计算公式:3.信息增益:表示得知特征X的信息而使得类Y的信息的不确定性减少的程度计算公式:infoGain = baseEntropy - EntropyAfter当infoGain > 0 ,表明集合信息熵减小,包含的信息更纯更有序,价值得到提高。当infoGain < 0,信息变得混沌。当infoGain = 0,信息原创 2021-06-26 23:54:01 · 789 阅读 · 1 评论 -
机器学习常见笔试题
Q1. 下面哪个对应的是正确的 KNN 决策边界? A. A B. B C. C D. D 答案:A 解析:本题考查的是 KNN 的相关知识点。 KNN 分类算法是一个比较成熟也是最简单的机器学习(Machine Learning)算法之一。该方法的思路是:如果一个样本在特征空间中与K个实例最为相似(即特征空间中最邻近),那么这 K 个实例中大多数属于哪个类别,则该样本也属于这个类别。其中,计算样本与其他实例的相似性一般采用距离衡量法。离得越近越相似,离得越远越不相似。因此,决策边界可能不转载 2021-06-25 18:32:16 · 1767 阅读 · 0 评论 -
机器学习面试常问题目
一 面试题概述面试的时候,面试官会结合你的回答和你的简历来询问你,所以在写简历的时候,简历上所写的所有内容在写的时候必须自己反问一下自己,这个知识点懂不懂。 面试其实是一个沟通技巧的考量,在面试的时候要“灵活”; 在有一些问题上,如果不会,那么直接说不会就可以;但是在一些比较关键的问题上,如果这个算法不会,最好可以稍微的提一下相关的算法,灵活回答。 机器学习/人工智能相关岗位在招聘人员的时候,主要考量的指标有以下几个方面: ①算法的思维能力 ②基本的算法原理 ③编程能力 ④数据结构能力(扩展了解)二 机.转载 2021-06-24 20:12:23 · 3194 阅读 · 0 评论 -
机器学习最常见的问题,过拟合、欠拟合
1.数据集数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。2.特征(属性)通过对样本数据的汇总,提取出对象或者事件在某方面的表现或性质的事项,提取出的这些表现或者事项我们称之为特征(feature)或者属性(attribute)。3.训练集和测试集将整个数据集分为训练集和测试集两个集合,训练集中的数据是用来在训练模型的过程中所使用的,通过对训练集中的数据对的某种潜在的规律而学得的模型,这一过程称之为“假设”。在这个过程中,就是对这个“假设”的一个验证过程,验证“假设”的真实度的原创 2021-06-24 20:05:18 · 373 阅读 · 0 评论 -
训练神经网络模型过程中batch_size,steps_per_epoch,epochs意义
batch_size:批大小。batch_size是计算效率和内存容量之间的平衡参数。若为高性能GPU,可以设置更大的batch_size值。神经网络训练过程中,随机梯度下降时,使用梯度的数量,即每次使用batch_size个数据样本来训练、更新权重参数。1次迭代等于使用batch_size个样本训练一次。 如果batch_size过小,训练数据就会非常难收敛,导致欠拟合。 增大batch_size,处理速度加快,但对计算设备的内存需求也相应增大。 ...转载 2021-06-20 10:06:51 · 3860 阅读 · 1 评论