python爬取的数据保存到表格中_Python3将爬取的数据存储到Excel

我们学习 Python3 爬虫的目的是为了获取数据,存储到本地然后进行下一步的作业,今天小雨就教大家 python3 如何将爬取的数据插入到 Excel

我们直接来讲如何写入 Excel 文件:

基本流程就是:新建工作簿--新建工作表--插入数据--保存工作表,和我们在电脑上面操作 excel 表是一样的。

workbook = xlwt.Workbook(encoding='utf-8')#创建 workbook 即新建 excel 文件/工作簿,

worksheet = workbook.add_sheet('my_worksheet') #创建工作表,如果想创建多个工作表,直接在后面再 add_sheet

worksheet.write(0,0,Value) #写入数据,共 3 个参数,第一个参数表示行,从 0 开始,第二个参数表示列从 0 开始,第三个参数表示插入的数值

workbook.save('top250.xlsx') #写完记得一定要保存

我们完成了第二个作业:输出豆瓣 top250 电影名,一行一个后,就可以把获取到的数据存储到 Excel 了。

Python3作业二:输出豆瓣top250电影名,一行一个

在python3 爬虫利器 Xpath:用 Xpath 提取文本这篇文章中,我们学会了用 Xpath 来提取网页中的文本,输出的格式是这样的 那么如何一行一个的输出呢? 这需要我们复习下小白教程中的列表和循环的章节,作为本次的第二个作业: 小雨给出了参考答案: 进群完成第二个作业后找群主索取密码 很多初学 pyt...

2018030213563257.jpg&w=142&h=142&zc=1

# coding:utf-8

from lxml import etree

import requests

import xlwt

title=[]

def get_film_name(url):

html = requests.get(url).text #这里一般先打印一下 html 内容,看看是否有内容再继续。

#print(html)

s=etree.HTML(html) #将源码转化为能被 XPath 匹配的格式

filename =s.xpath('//*[@id="content"]/div/div[1]/ol/li/div/div[2]/div[1]/a/span[1]/text()') #返回为一列表

#print (filename)

title.extend(filename)

def get_all_film_name():

for i in range(0, 250, 25):

url = 'https://movie.douban.com/top250?start={}&filter='.format(i)

get_film_name(url)

if '_main_':

myxls=xlwt.Workbook()

sheet1=myxls.add_sheet(u'top250',cell_overwrite_ok=True)

get_all_film_name()

for i in range(0,len(title)):

sheet1.write(i,0,i+1)

sheet1.write(i,1,title[i])

myxls.save('top250.xls')

输出结果如下:

2018032212350058.gif

之前有小伙伴问如何将 250 个电影名全部输出来,实际上就是把网址根据规律循环一下就好了,可以参考上面的代码,还有就是列表的合并,这些基础知识在群文件的小白教程里都有介绍。

很多初学 python 的朋友,苦于找不到一群志同道合的朋友,小雨给大家提供了一个平台,一个纯粹学习 python 的交流平台,274728691 这是我的 QQ 号,也是 python 从入门到入魔的群号,欢迎加入。

加入须知:

Python3学习群重要通知,群友必看!

很多人进群后不及时提交作业,不珍惜这个学习的机会,陌小雨就设置一些门槛,特此申明如下(2018-3-14): 很多初学 python 的朋友,苦于找不到一群志同道合的朋友,陌小雨给大家提供了一个平台,一个纯粹学习 python 的交流平台,274728691 这是陌小雨的 QQ 号,也是 python 从入门到入魔的群号(...

2018031412132680.jpg&w=142&h=142&zc=1

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值