kaggle房价预测:项目流程

1.下载和缓存数据集;2,读取数据集;3,数据预处理;4,训练流程函数设定;5,k折验证函数;6,k折训练流程来寻找较好超参数;7,利用超参数来更新预测

详细流程以及函数注意:

一.下载和缓存数据集:核心三个函数:0-建立含有网址和哈希码的字典,便于之后判断和提取;

1-从网页获取数据集:

                {1-对输入文件进行assert判断其是否位于字典中(关键字);

                2-如果在字典中,判断其路径是否存在,使用exist()函数判断(没有对应文件夹可以makedirs先创建一个)

                第二部分为两个:如果存在,进入内层逻辑,with open文件后利用for加read函数进行迭代读取,每次把读取的内容传入sha1()中,之后利用sha1.hexdigest()和原本存放在字典中的哈希码比较,如果相同,通过return来返回文件路径并结束下载函数,如果不同,则结束exist()内层逻辑,进入后面的下载步骤。

                3-下载步骤(在exist判断失败后):利用reguest.get()函数通过网址下载,并且下载完后with open文件用.write(f.content)写入,并且返回文件路径}

2-对获得的数据集进行解包:

                {1-首先利用path.dirname获取上层目录(之后用来指定解压目录),

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值