机器学习算法
文章平均质量分 94
lynn_321
这个作者很懒,什么都没留下…
展开
-
从sklearn说机器学习
SKlearn简介scikit-learn,又写作sklearn,是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法应用,并且涵盖了几乎所有主流机器学习算法。SKlearn官网:scikit-learn: machine learning in Python在工程应用中,用python手写代码来从头实现一个算法的可能性非常低,这样不仅耗时耗力,还不一定能够写出构架清晰,稳定性强的模型。更多情况下,是分析采原创 2022-03-23 11:56:06 · 2554 阅读 · 0 评论 -
机器学习中的模型评估方法和指标
机器学习模型的评估方法和指标1、选择怎样的评估指标1.1 Online metrics vs Offline metricsOnline metrics是直接在线上环境做AB测试,比较两个实验组的核心指标,比如CTR、转化率等。Offline metrics是希望在模型上线之前,使用历史数据进行效果评估。离线指标有些是纯数学模型指标,有些是结合实际问题的量化指标。1.2 单值评估指标 vs 多值评估指标单值评估指标清晰明了,有利于最终的评估。如果有多个指标都是很重要的,可以将这多个值原创 2022-03-22 14:55:12 · 5270 阅读 · 0 评论 -
机器学习算法的优缺点
决策树一、 决策树优点1、决策树易于理解和解释,可以可视化分析,容易提取出规则。2、可以同时处理标称型和数值型数据。3、测试数据集时,运行速度比较快。4、决策树可以很好的扩展到大型数据库中,同时它的大小独立于数据库大小。二、决策树缺点1、对缺失数据处理比较困难。2、容易出现过拟合问题。3、忽略数据集中属性的相互关联。4、ID3算法计算信息增益时结果偏向数值比...转载 2019-09-17 13:13:09 · 4193 阅读 · 0 评论 -
聚类和分类的区别
分类算法与聚类算法的区别:1.类别是否预先定义是最直观区别算法书上往往这样解释二者的区别:分类是把某个对象划分到某个具体的已经定义的类别当中,而聚类是把一些对象按照具体特征组织到若干个类别里。虽然都是把某个对象划分到某个类别中,但是分类的类别是已经预定义的,而聚类操作时,某个对象所属的类别却不是预定义的。所以,对象所属类别是否为事先,是二者的最基本区别。而这个区别,仅仅是从算法实现流程来...原创 2019-09-17 13:20:29 · 35981 阅读 · 4 评论