实训小结(1)

今日数据清洗流程
(一)使用Python爬取安居客网站的历史房价信息
通过分析网站结构,用crawlcityhouse.py爬取生成结果文件anjuke.csv
(二)然后将anjuke.csv文件内容复制到txt文件中,形成txt文件
(三)对txt文件进行数据清洗,通过cleandata.py,提取时间信息,生成anjuke_demo.txt
(四)最后通过txt_transform_csv.py转为history.csv
(五)手动,通过Excel,用选中区域,按f5去掉空白行,形成最终文件

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值