python——xlwt库的使用(1)
菜鸟笔记——以防忘记
近日帮同学做了一个数据分析的作业,用到了将数据写入excel中的操作,这个作业做的是房价分析~将整个过程记录下来~~
一. 爬取数据
数据来源于:http://www.fangjiachina.com/
查看网页源码,找到我们将要爬取的数据~
截图如下:
分析可知,我们要爬取的数据主要是:地点+房价
我们用一个正则表达式将数据提取出来即可,因为爬取并不是重点,我们就直接上代码:
#coding:utf-8
import requests
import re
url="http://www.fangjiachina.com/"
response=requests.get(url)
data=response.text
pattern=re.compile(r"<span><em.*?>(.*?)</em><font>(.*?)</font>(.*?)</span>")
new_datas=re.findall(pattern,data)
for i in new_datas:
j=i[0]+i[1]+i[2]
print j
运行结果如图:
ok了,下面就是将数据写入excel中
二. 与excel做数据交互
1、写入数据
(1)首先需要下载安装xlwt库,博主是用的pycharm,因此就直接用pycharm中下载安装了;不用pycharm的朋友可以用以下网址下载:
http://download.csdn.net/download/nuannuanda/9219457
(2)安装完成之后就可以开始实践了~~