Python-机器学习入门及技巧总结

最新推荐文章于 2024-08-26 15:35:53 发布

yu_tsl

最新推荐文章于 2024-08-26 15:35:53 发布

阅读量5.8k

点赞数 2

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yu_tsl/article/details/78796669

版权

本文介绍了Python机器学习的基本流程和实用技巧，包括数据读取、数据分析（一元和多元）、模型建立以及模型融合。重点提及了Pandas、Seaborn、matplotlib等工具在数据处理和可视化中的应用，以及XGBOOST算法和Stacking模型融合技术。

摘要由CSDN通过智能技术生成

随着这两年人工智能的快速发展，机器学习与深度学习行业炙手可热，对于那些想进入这个行业的同学们，小编在这里给大家介绍一下自己的心得体会以及利用Python的一些小技巧，希望对大家有所帮助。

在机器学习方面，对于想入门的新手，首先不得不提就是斯坦福大学的Andrew Ng-吴恩达，他在例如Coursera等网站上面的课程非常适合新手，并且当你入门之后，回头再看，又会有新的收获，在这里我把相应的链接放在这里Machine Learning | Coursera。

对于一个机器学习工程，或者参加例如kaggel、天池之类的比赛也好，流程都是类似的，小编在这里对前人的工作进行了一下总结。流程如下：

对数据进行简单的清洗与处理，得到一些基本特征。
建立简单的机器学习模型，按照重要性对特征进行排列。
根据得到的特征排列，有针对的进行特征工程，提取特征
重复上述过程，不断的优化自己的模型，找到关键的特征
对模型的参数进行调参，采用例如grid search的方法找到最优参数
进行模型融合，采用如Stacking 的方法得到最佳模型组合

对于实际的机器学习工程问题，数据的获取以及清洗是一件非常头疼事情，在这个方面要花费非常大的精力，而我们上述的流程比较适合一些初步清洗较好的数据，比较适用于一些比赛项目流程。

好了，说完机器学习基本流程，下面我们来说一下技巧了。目前，在机器学习方面最流行的有两种语言，一个是R，另外一个是Python，在这里小编介绍一下利用Python进行机器学习的一些小技巧，这些技巧对于大家的特征工程都有很大的帮助。

1. 数据读取

一般采用Python 的pandas 包，大部分数据集都可以利用它来读取࿰

最低0.47元/天解锁文章

关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

yu_tsl CSDN认证博客专家 CSDN认证企业博客

码龄7年

12: 原创

32万+: 周排名

42万+: 总排名

3万+: 访问

: 等级

537: 积分

15: 粉丝

13: 获赞

6: 评论

67: 收藏

私信

关注

热门文章

分类专栏

最新评论

2018 阿里秋招面试心得
HardLifes.cpp: 博主，一年后怎么样了
2018 阿里秋招面试心得
TAlice: 博主后续呢
Python-机器学习入门及技巧总结
Steve1005 回复普通网友: 你好，解压密码是什么？
Python-机器学习入门及技巧总结
普通网友: Python机器学习全流程项目实战精讲（2018版）网盘地址：https://pan.baidu.com/s/1BLFXWHQz5wd-4T3nrAfgDw 提取码: bkj9 备用地址（腾讯微云）：https://share.weiyun.com/5VGzPK0 密码：yp4ri9
2018 阿里秋招面试心得
mr_guo_lei: 同秋招中，博主找到工作否

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。