python爬虫写入excel时出错之前爬的数据在哪儿_Python爬虫爬数据写入到EXCEL中

该博客介绍了如何使用Python的xlwt库将抓取的数据直接写入Excel文件,避免了先写入txt再导入Excel的步骤。示例代码展示了从网页抓取颜色名称和十六进制代码,写入到Excel的不同单元格中。遇到的问题是使用XLWD模块时数据写入不稳定,故改用XLWT。此外,提供了打开和修改已有Excel文件的方法链接。
摘要由CSDN通过智能技术生成

Python抓数据写到EXCEL中。以前都是写到txt中然后再导入到excel。现在直接写到excel中。#coding=utf-8

import xlwt

import requests

from bs4 import BeautifulSoup

import sys

reload(sys)

sys.setdefaultencoding('utf8')

#打开excel文件

data=xlwt.Workbook()

#获取其中的一个sheet

table=data.add_sheet('made')

# table.put_cell(0,2,1,'why',0)

# nrows=table.nrows

# ncols=table.ncols

# for i in range(nrows):

# print table.row_values(i)

r=requests.get('http://html-color-codes.info/color-names/')

html=r.text

#print html

soup=BeautifulSoup(html,'html.parser')

trs=soup.find_all('tr')

row=0

col=0

for tr in trs:

style=tr.get('style')

tds=tr.find_all('td')

td=[x for x in tds]

name=td[1].text.strip()

hex=td[2].text.strip()

table.write(row,col,name)

table.write(row,col+1,hex)

table.write(row,col+2,style)

row=row+1

col=0

data.save('MADE.xls')

PS:本来用的是XLWD这个模块,但是在测试写入到单元格时候不知道为什么,写进去立刻读能读出来数据,但是再写数据就没了,,,,也就没怎么看了。直接用了XLWT。但是他需要每次都是新建一个EXCEL然后新建一个sheet,并不难打开已经存在的excel。。。。。。。好像有办法解决,,,后面有需要再看吧。

附一个打开修改已存在excel的办法http://www.360doc.com/content/13/1119/16/11029609_330538996.shtml

再附一个xlwd的高级用法,包括修改字体设置格式等http://www.xuebuyuan.com/1568560.html

这里面有合并单元格的操作http://www.jb51.net/article/60510.htm

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值