机器学习实战总结

本博客主要摘录了《机器学习实战》里面对各个算法的总结

K-近邻算法

优点

精度高、对异常值不敏感、无数据输入假定

缺点

计算复杂度高、空间复杂度高

适用范围

数值型和标称型

决策树

优点

计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据

缺点

可能会产生过度匹配的问题

适用范围

数值型和标称型

朴素贝叶斯

优点

在数据较少的情况下仍然有效,可以处理多类别问题

缺点

对于输入数据的准备方式比较敏感

适用范围

标称型数据

逻辑回归

优点

计算代价不高,容易理解和实现

缺点

容易欠拟合,分类精度可能不高

适用范围

数值型和标称型数据

支持向量机

优点

泛化错误率低,计算开销不大,容易解释

缺点

对参数调节和核函数的选择敏感,原始分类器不加修饰仅适用于处理二类问题

适用范围

数值型和标称型数据

AdaBoost

优点

泛化错误率低,易编码,可以应用在大部分分类器上,无参数调整

缺点

对离群点敏感

适用范围

数值型和标称型数据

线性回归

优点

结果易于理解,计算上不复杂

缺点

对非线性的数据拟合不好

适用范围

数值型和标称型数据

树回归

优点

可以对复杂和非线性的数据建模

缺点

结果不易理解

适用范围

数值型和标称型数据

K-均值

优点

容易实现

缺点

可能收敛到局部最小值,在大规模数据集上收敛较慢

适用范围

数值型数据

Apriori算法

优点

易编码实现

缺点

在大数据集上可能较慢

适用范围

数值型和标称型数据

FP-growth算法

优点

一般要快于Apriori

缺点

实现比较困难,在某些数据集上性能会下降

适用范围

标称型数据

PCA

优点

降低数据的复杂性,识别最重要的多个特征

缺点

不一定需要,且可能损失有用信息

适用范围

数值型数据

SVD

优点

简化数据,去除噪声,提高算法结果

缺点

数据的转换可能难以理解

适用范围

数值型数据

MapReduce

优点

可在短时间内完成大量工作

缺点

算法必须经过重写,需要对系统工程有一定的理解

适用范围

数值型和标称型数据

转载于:https://www.cnblogs.com/-Sai-/p/7783476.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kaggle是一个非常适合初学者去实操实战技能的网站,它提供了各种机器学习项目供用户参与。通过在Kaggle上完成项目,你可以评估自己的得分和排名,从而更清楚地了解自己的能力水平。此外,Kaggle还提供了许多项目的教程,可以帮助你学习各种操作并逐步熟悉机器学习的实践。在平时的学习中,我们更多地接触到的是理论知识,缺少实战的平台和项目练习。因此,通过在Kaggle上进行机器学习项目实战,你可以巩固自己的知识,并发现更多有用的技能。\[1\] 在Kaggle上,你可以找到各种机器学习项目,其中包括房价预测项目。在这个项目中,你可以使用各种机器学习算法来预测房价。例如,你可以使用sklearn库中的线性算法,它利用了BLAS算法库,具有高效率和性能优势。相比于集成算法,如GradientBoost等,线性算法的运行时间更短,例如在做CrossValidate和Lasso时只需要20秒左右,而集成算法需要约200~300秒左右。\[2\] 在进行机器学习项目实战时,你可以创建多个模型来进行比较和评估。常见的模型包括K近邻分类器(KNeighborsClassifier)、逻辑回归(LogisticRegression)、高斯朴素贝叶斯分类器(GaussianNB)、决策树分类器(DecisionTreeClassifier)、随机森林分类器(RandomForestClassifier)、梯度提升分类器(GradientBoostingClassifier)和支持向量机分类器(SVC)等。通过创建多个模型并进行比较,你可以找到最适合解决问题的模型。\[3\] #### 引用[.reference_title] - *1* *3* [机器学习实战——kaggle 泰坦尼克号生存预测——六种算法模型实现与比较](https://blog.csdn.net/yangshaojun1992/article/details/106314927)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [Kaggle机器学习实战总结](https://blog.csdn.net/BF02jgtRS00XKtCx/article/details/78937265)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值