数分面试常见机器学习问题【更新中】

这篇主要是搜集了数分面经中出现的有关机器学习的问题,会一直更新的哦。

关于模型一般是从原理、优缺点、应用场景和优化方式四方面来总结。

有监督学习

决策树

决策树(Decison Tree)也称分类树或回归树,它是一个树状结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果。

与线性模型(逻辑回归、神经网络等)不同,它的学习过程不是为每个特征学习一个权重,而是根据某种决策不断地对数据集进行分裂,使得到的子数据集上的标签越来越纯净,最终得到的模型就是一个树形结构。

原理

决策树有很多种,三种经典决策树:

ID3
C4.5
C5.0

优缺点

  • 优点
    数据准备简单,不要求数据属性统一,对缺失值不敏感,能够处理不相关的特征,计算量小,效率高,可解释性强

  • 缺点
    对连续性字段较难预测;处理特征关联性很强的数据时表现不佳;趋向过拟合;可能陷入局部最小值中;没有在线学习

应用场景

因为它能够生成清晰的基于特征(feature)选择不同预测结果的树状结构,数据分析师希望更好的理解手上的数据的时候往往可以使用决策树。

受限于它的简单性,决策树更大的用处是作为一些更有用的算法的基石

优化方式

  1. 修剪枝叶

    • 前置裁剪
    • 后置裁剪
  2. 随机森林(Random Forest)

1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值