1. 人工智能与机器学习的区别?
基于经验数据的特性而设计和开发的算法被称为机器学习。
而人工智能不但包括机器学习,还包括诸如知识表示,自然语言处理,规划,机器人技术等其它方法。
规则推理是指把相关领域的专家知识形式化的描述出来,形成系统规则。
2.在哪些领域使用模式识别技术?
模式识别被应用在:
1.计算机视觉 2.语言识别 3.统计 4.数据挖掘 5. 非正式检索 6. 生物信息学。
3. 我们不需要了解数据科学和机器学习的更深层次原理,只需要知道他们的基本原理即可,我们应该更关心如何将它们应用到实际问题中去创造价值。
大多数时候或者大多数从业者的目标不是发明一种新的机器学习算法,而是向客户展示潜在的机器学习对他们的业务有没有帮助。
4. 对于分类问题,数据偏斜补鞥呢过于严重,不同类别的数据数据量不能有数个数量级的差距。数据量太大可以减少训练样本、姜维、或者使用分布式机器学习系统。
5.数据挖掘的大部分时间都花在特征工程上面,包括数据预处理、数据清洗、特征筛选等是机器学习基础而又必备的工作。
6.机器学习有很多的现成工具包,真正考验水平的是对算法的理解,通过调节参数使迷行达到最优,模型诊断中,至关重要的是判断过拟合、欠拟合,常见的方法是绘制学习曲线,交叉验证。
通过增加数据量、降低模型复杂度、减少模型参数来降低过拟合。
通过提高特征的数量、增加模型复杂度来防止欠拟合。
7.使用测试数据来验证模型的有效性,观察误差样本,分析误差产生的原因,。
8.模型融合:提升算法准确度的主要方法是模型的前端(特征工程、清洗、预处理、采样)和后端的模型融合,模型的融合方法主要包括一人一票,线性融合和堆融合。
9.训练集中的数据分为训练数据training data和测试数据testing data
20.k-折叠交叉验证:将数据集分为k份,总共训练k次,每次以k-1份作为训练集,1份作为验证集,得到验证集上的性能,将k次结果平均,作为模型的性能指标。