今日数据清洗流程
(一)使用Python爬取安居客网站的历史房价信息
通过分析网站结构,用crawlcityhouse.py爬取生成结果文件anjuke.csv
(二)然后将anjuke.csv文件内容复制到txt文件中,形成txt文件
(三)对txt文件进行数据清洗,通过cleandata.py,提取时间信息,生成anjuke_demo.txt
(四)最后通过txt_transform_csv.py转为history.csv
(五)手动,通过Excel,用选中区域,按f5去掉空白行,形成最终文件
实训小结(1)
最新推荐文章于 2019-06-25 09:41:52 发布