通过爬虫获取银行名称

刚接触Python语言,在网上学习了一个教学视频,然后把视频中的代码敲了一遍,可运行


开发环境:Python 3.6.1  +  PyCharm Professional  2017.1.4


Pycharm 下载地址:


excel插件xlwt的 安装方法:
1、在 https://pypi.python.org/pypi/xlwt 下载 xlwt-1.2.0.tar.gz 文件
2、右键解压后,执行 setup.py
3、CMD 窗口执行命令:pip install xlwt


# _*_ coding:utf-8 _*_
import xlwt
import urllib.request, re

def getdata():
    for i in range(1, 3):
        url = 'http://furhr.com/?page={}'.format(i)

        try:
            html = urllib.request.urlopen(url).read()
            html = html.decode('utf-8')
            # print(html)
        except Exception as e:
            print(e)
            continue

    # <tr><td>15</td><td>104881004090</td><td>中国银行股份有限公司乌鲁木齐市中山路支行</td><td>0991-2326787</td><td>新疆乌鲁木齐市中山路159号</td></tr>
    page_list = re.findall(r"<tr><td>\d+</td><td>\d+</td><td>(.*?)</td><td>(.*?)</td><td>(.*?)</td></tr>", html)
    return page_list


def excel_write():
    newTable = 'test123.xls'   # C:\Users\Administrator\PycharmProjects\untitled1\test123.xls
    wb = xlwt.Workbook(encoding='utf-8')
    ws = wb.add_sheet('sheet1')
    headdata = ['公司名称', '电话', '地址']
    for colnum in range(0, 3):
        ws.write(0, colnum, headdata[colnum], xlwt.easyxf('font:bold on'))

    index = 1
    for item in items:
        for i in range(0, 3):
            ws.write(index, i, item[i])
        index += 1

    wb.save(newTable)


if __name__ == '__main__':
    items = getdata()
    excel_write()


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值