kaggle房价预测：项目流程

hlhwna

于 2023-04-07 08:03:26 发布

阅读量195

点赞数

文章标签：深度学习 python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hlhwna/article/details/129977945

版权

1.下载和缓存数据集；2，读取数据集；3，数据预处理；4，训练流程函数设定；5，k折验证函数；6，k折训练流程来寻找较好超参数；7，利用超参数来更新预测

详细流程以及函数注意：

一.下载和缓存数据集：核心三个函数：0-建立含有网址和哈希码的字典，便于之后判断和提取；

1-从网页获取数据集：

{1-对输入文件进行assert判断其是否位于字典中（关键字）；

2-如果在字典中，判断其路径是否存在，使用exist()函数判断（没有对应文件夹可以makedirs先创建一个）

第二部分为两个:如果存在，进入内层逻辑，with open文件后利用for加read函数进行迭代读取，每次把读取的内容传入sha1()中，之后利用sha1.hexdigest()和原本存放在字典中的哈希码比较，如果相同，通过return来返回文件路径并结束下载函数，如果不同，则结束exist()内层逻辑，进入后面的下载步骤。

3-下载步骤（在exist判断失败后）：利用reguest.get()函数通过网址下载，并且下载完后with open文件用.write(f.content)写入，并且返回文件路径}

2-对获得的数据集进行解包：

{1-首先利用path.dirname获取上层目录（之后用来指定解压目录），

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
kaggle房价预测：项目流程

第一个参数是文件的目录，第二个包含四种模式'r','w','rb','wb'，'r''w'会以文本的方式打开文件，内容包含字符串等都可以,'rb''wb'会以二进制数字类型打开，数据会全部以二进制展示。3.os.makedirs( ,exist_ok=)，这是一个文件夹（目录）创建函数，第一个参数是文件夹（目录，可以是多级）（mksir是只能新建一级），第二个参数如果True，则当目录已经存在，跳过该语句，如果False则会报错并中断执行。tarfile-用来解压'tar''gz'格式文件的库；
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。