通过爬虫获取银行名称

最新推荐文章于 2023-10-05 23:25:32 发布

原始新人类

最新推荐文章于 2023-10-05 23:25:32 发布

阅读量1.7k

点赞数

分类专栏：爬虫文章标签： python 爬虫

爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

刚接触Python语言，在网上学习了一个教学视频，然后把视频中的代码敲了一遍，可运行

开发环境：Python 3.6.1 + PyCharm Professional 2017.1.4

 
 Pycharm 下载地址： 

 
 https://www.jetbrains.com/pycharm/download/#section=windows 

  excel插件xlwt的 
 安装方法： 

 
 1、在 
 https://pypi.python.org/pypi/xlwt 
  下载 xlwt-1.2.0.tar.gz 文件 

 
 2、右键解压后，执行 setup.py 

 
 3、CMD 窗口执行命令：pip install xlwt 

# _*_ coding:utf-8 _*_
import xlwt
import urllib.request, re

def getdata():
    for i in range(1, 3):
        url = 'http://furhr.com/?page={}'.format(i)

        try:
            html = urllib.request.urlopen(url).read()
            html = html.decode('utf-8')
            # print(html)
        except Exception as e:
            print(e)
            continue

    # <tr><td>15</td><td>104881004090</td><td>中国银行股份有限公司乌鲁木齐市中山路支行</td><td>0991-2326787</td><td>新疆乌鲁木齐市中山路159号</td></tr>
    page_list = re.findall(r"<tr><td>\d+</td><td>\d+</td><td>(.*?)</td><td>(.*?)</td><td>(.*?)</td></tr>", html)
    return page_list


def excel_write():
    newTable = 'test123.xls'   # C:\Users\Administrator\PycharmProjects\untitled1\test123.xls
    wb = xlwt.Workbook(encoding='utf-8')
    ws = wb.add_sheet('sheet1')
    headdata = ['公司名称', '电话', '地址']
    for colnum in range(0, 3):
        ws.write(0, colnum, headdata[colnum], xlwt.easyxf('font:bold on'))

    index = 1
    for item in items:
        for i in range(0, 3):
            ws.write(index, i, item[i])
        index += 1

    wb.save(newTable)


if __name__ == '__main__':
    items = getdata()
    excel_write()

原始新人类

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
通过爬虫获取银行名称

刚接触Python语言，在网上学习了一个教学视频，然后把视频中的代码敲了一遍，可运行开发环境：Python 3.6.1 + PyCharm 2017.1.4Pycharm 下载地址：https://www.jetbrains.com/pycharm/download/#section=windowsexcel插件xlwt的安装方法：1、在
复制链接

扫一扫