《阿里云天池大赛赛题解析—机器学习篇》总结

weixin_61428310

于 2024-07-22 15:11:40 发布

阅读量585

点赞数 13

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_61428310/article/details/140610203

版权

目录

一、常用回归预测模型... 9

线性回归模型：... 9

二、数据处理... 14

变量分析总结：... 14

单变量分析... 14

双变量分析... 14

缺失值处理总结... 17

缺失值主要分为以下四类: 17

缺失值的处理万法... 17

异常值总结: 18

变量转换总结：... 18

常用方法：... 19

新属性生成总结：... 19

高维组合特征的处理... 19

生成的方法... 20

三、特征工程... 20

特征处理... 21

标准化... 21

区间缩放法... 22

归一化... 22

定量特征二值化... 23

定性特征哑编码... 23

特征降维... 23

特征选择... 24

线性降维... 25

四、交叉验证... 25

简单交叉验证... 26

k折交叉验证... 26

留一法交叉验证LOO—CV.. 26

留p法交叉验证... 26

五、模型调参... 27

网格搜索... 27

随机搜索... 27

遗传算法（GA）... 28

六、特征优化... 30

合成特征... 30

特征的简单变换... 30

用决策树创造新特征... 31

七、模型融合... 31

预测结果融合策略... 32

Voting（投票机制）... 32

Averageandranking. 32

八、常见的数据分布... 34

伯努利分布... 34

二项分布... 34

超几何分布... 34

几何分布... 34

泊松分布... 35

指数分布... 35

九、文本表示模型... 35

词袋模型... 35

主题模型... 36

十、 PyTorch搭建基础神经网络... 36

常用回归预测模型

使用的算法包括线性回归（LinearRegressjon）、岭回归（RldgeRegression）、LASSO（LeastAbsoluteShrinkageandSelectlonOperator）回归、决策树回归（DeclsjonTreeRegressor）、梯度提升树回归（Grad1e11tBoostmgDecisonTreeRegressor等。通过查阅资料熟悉如何使用sklearn调用。

线性回归模型：

fromsklearn.model_selectionimporttrain_test_split

fromsklearn.linear_modelimportLinearRegression

x_train,x_test,y_train,y_test=train_test_split(a,b,test_size=0.2)

clf=LinearRegression()

rf=clf.fit(x_train,y_train.ravel())

y_pred=rf.predict(x_test)

KNN回归模型

fromsklearn.neighborsimportKNeighborsRegressor

x_train,x_test,y_train,y_test=train_test_split(a,b,test_size=0.2)

clf=KNeighborsRegressor()

rf=clf.fit(x_train,y_train.ravel())

y_pred=rf.predict(x_test)

SVM回归模型

fromsklearn.svmimportSVR

x_train,x_test,y_train,y_test=train_test_split(a,b,test_size=0.2)

clf=SVR()

rf=clf.fit(x_train,y_train.ravel())

y_pred=rf.predict(x_test)

print("SVR结果如下：")

print("训练集分数：",rf.score(x_train,y_train))

print("验证集分数：",rf.score(x_test,y_test))

岭回归模型

fromsklearn.linear_modelimportRidge

x_train,x_test,y_train,y_test=train_test_split(a,b,test_size=0.2)

clf=Ridge()

rf=clf.fit(x_train,y_train.ravel())

y_pred=rf.predict(x_test)

print("Ridge结果如下：")

print("训练集分数：",rf.score(x_train,y_train))

print("验证集分数：",rf.score(x_test,y_test))

最低0.47元/天解锁文章

weixin_61428310

关注

13
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
《阿里云天池大赛赛题解析—机器学习篇》总结

可用于考试复习，面试准备，项目等
复制链接

扫一扫

weixin_61428310 CSDN认证博客专家 CSDN认证企业博客

码龄3年

7: 原创

177万+: 周排名

17万+: 总排名

2038: 访问

: 等级

100: 积分

24: 粉丝

23: 获赞

5: 评论

35: 收藏

私信

关注

热门文章

最新评论

plt绘图时当x轴为时间类型时如何均匀分布
普通网友: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
plt绘图时当x轴为时间类型时如何均匀分布
普通网友: 学到了！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
plt绘图时当x轴为时间类型时如何均匀分布
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
shell脚本学习
CSDN-Ada助手: 恭喜您写了第四篇博客，标题为“shell脚本学习”，非常值得称赞！您对shell脚本的学习和分享，不仅对自己的技能提升有益，也对广大读者有着巨大的帮助。接下来，我希望您能继续保持这样的创作热情，并进一步探索更深入的shell脚本学习内容，比如常用的shell命令、实践案例等。相信您的努力会让更多的读者受益，期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。