es文件浏览器怎么用_python爬虫25 | 爬取下来的数据怎么保存? CSV 了解一下

f4493a718ed66ac317680f4d6f5fa2d5.png

​大家好


我是小帅b


是一个练习时长两年半的练习生


喜欢


唱!


跳!


rap!


篮球!


敲代码!


装逼!



5bbb085199b964b33d757da4a310cbeb.png



不好意思


我又走错片场了


接下来的几篇文章


小帅b将告诉你


如何将你爬取到的数据保存下来


有文本文件、redis、数据库(MySQL、MangoDB)等的存储方式


今天先说说


CSV


什么是 CSV?

怎么玩?

牛逼么?


那么接下来就是


学习 Python 的正确姿势




72dd4eb665ebc2bd740c83519dea3a0e.png




CSV 是一个文本文件来的


有点像 excel


也就是它是以一定的表格的格式来展示数据的


我们通常会使用逗号(,)来对每一个单元数据进行分割


分隔符不止是逗号


也可以是制表符(tab)、冒号(:)、分号(;)


比如我们要来表示一个表格中的数据


就可以这样


第1列的名称,第2列的名称,第3列的名称
第1行第1格的数据,第1行第2格的数据,第1行第3格的数据
第2行第1格的数据,第2行第2格的数据,第2行第3格的数据
...



这就是 CSV 的格式



6f669672f27b2c4732563e161835cdd1.gif



有啥好处呢


说 3 点足以


它支持存储比较大量的数据


我们可以非常方便地利用它进行数据的导入或者导出到电子表格或者数据库


所有支持文本文件的输入输出的编程语言(比如我们的 python),都可以直接操作使用 CSV 文件。



d196525ce54db6613c8ee70cf5f027bd.png





了解什么是 CSV 之后


接下来小帅b会告诉你怎么使用 python 去存储数据到 CSV 文件中


代码走起



ba16341496b1c7494b2d599df835f2d8.png



我们导入 CSV 这个库


通过 csv.DictWriter 获取 writer 对象


然后就可以写入了


具体看下代码

import csv
​
with open('xiaoshuaib.csv', mode='w') as csv_file:
    fieldnames = ['你是谁', '你几岁', '你多高']
    writer = csv.DictWriter(csv_file, fieldnames=fieldnames)
​
    writer.writeheader()
    writer.writerow({'你是谁': '小帅b', '你几岁': '18岁', '你多高': '18cm'})
    writer.writerow({'你是谁': '小帅c', '你几岁': '19岁', '你多高': '17cm'})
    writer.writerow({'你是谁': '小帅d', '你几岁': '20岁', '你多高': '16cm'})


我们这里以字典的方式写入数据到 xiaoshuaib.csv 这个文件中


运行之后


可以看到多了一个文件



0ea53e4bd6b9340c7db2f5f116b9e1e8.png



打开看看



ffd74add780a231888b098fe2fdacf70.png



可以看到


我们的数据就被写进来了


说:是高还是长?



1f4341f91962a4ccd2d0643da60a628a.gif



再给大家介绍一个库


pandas


它可以更加方便的操作 CSV 文件


我们先安装一下 pandas


pip install pandas


安装完之后


我们用 pandas 来读取一下我们刚存储的 xiaoshuaib.cvs 文件

import pandas
xiaoshuaib = pandas.read_csv('xiaoshuaib.csv')
print(xiaoshuaib)


打印结果是这样的



8ddc75794353bc440bad19786a3bb4e8.png



是不是又方便又好看呢


用 pandas 来存储 CSV 数据也是很简单的


一个方法就搞定


to_csv

import pandas as pd
​
b = ['小帅b', '小帅c', '小帅d']
c = ['18岁', '19岁', '20岁']
d = ['18cm', '17cm', '16cm']
​
df = pd.DataFrame({'你是谁' : b, '你几岁' : c, '你多高' : d})
df.to_csv("xsb.csv", index=False, sep=',')


运行一下



273a606561f4edf2daaf0eb9c19d4dc6.png




ok


以上就是对 CSV 的主要操作


当你把数据爬取下来的时候


可以使用这招试试把数据存储下来


好了


那么我们下篇再见


peace



2da6da08034cd39662b66770a84f8d4e.png




7964bbaf832c8260878dc2d47e0bec08.png



猜你喜欢


python爬虫24 | 搞事情了,用 Appium 爬取你的微信朋友圈。


python爬虫21 | 对于b站这样的滑动验证码,不好意思,照样自动识别



点个赞啊~~(破音)


51a251eca74db50f09ab93efcab95be9.gif

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值