【数据挖掘与分析】python网络爬虫学习及实践记录 | part 04-数据存储 【json vs CSV vs excel】

本文记录了Python网络爬虫学习中的数据存储环节,对比了json、CSV和Excel三种存储方式。重点介绍了如何将数据转换为json字符串、处理编码问题、加载json数据为Python对象,以及读取CSV文件的两种方法。实习和工作可能影响学习进度,但作者强调了坚持的重要性,计划在九月份前完成相关学习。
摘要由CSDN通过智能技术生成

经历了一个星期的实习和半个星期的休假,回复到正常的云胡实验室生活来。每日学习才是正常的作息,前面每天下班回家后还是有练习代码,虽然博文更新的慢,而且没有开新的帖子,有每天坚持在GitHub上更新练习情况。之前卡在数据解析部分,前十个,从跟随式,到自己思考,爬取老师示范讲解的不同部分的内容,再到拿到先自己分析,在思考方式上有比较大的进步。花费的时间也有些长了,好在,回归实验室生活后。解析老师的任务,能够在比较短的时间爬到目标内容,这个开新帖分析,不在这里说了。主要就是指这段时间学习没有中断,零零散散的,好在一直都有坚持,也有一点点成果。

 昨天爬到两个市的内容后在思考一个问题,手动替换爬取条件还是不行,需要自动爬,研究了一下代码发现,在存储方面的内容知识点在第四部分,所以这里就开了新篇,先把第四部分学完再倒头来跟part3,后面内容不复杂的话会直接把学记补充在part3的那帖上面,有额外需要注意或者练习讲解部分再开新文,这是后话。

不得不说,实习和工作、放假真的会影响进度,而且没有任务驱动的情况下,学习速度非常慢。这里part3才学了10番,加速度啊,九月份前,这个需要完全刷完的!!!

 以上部分是前言。


下面把这部分需要学习的内容贴出来:相较于前三部分真的算很少了,最好一天搞定。

1.json字符串介绍

JSON(JavaScript Object Notation,JS对象标记)

     

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值