【Python实用技巧】爬取数据保存到Excel中

最新推荐文章于 2024-03-29 16:44:41 发布

「已注销」

最新推荐文章于 2024-03-29 16:44:41 发布

阅读量2.4k

点赞数 3

分类专栏： python 文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/yxczsz/article/details/126934029

版权

嗨嗨，大家好~今天来给你们分享一个小技巧

如何用python爬取数据保存到Excel中

话不多说，马上开始

请添加图片描述

需要源码、教程，或者是自己有关python不懂的问题，都可以来这里哦 https://jq.qq.com/?_wv=1027&k=s5bZE0K3 这里还有学习资料与免费课程领取

开发工具

Python版本：3.6
相关模块：

import requests
from lxml import etree
import time, random, xlwt

主要思路

1.两页的内容
2.抓取每页title和URL
3.根据title创建文件，发送URL请求，提取数据

展示效果

请添加图片描述

完整代码

需要源码、教程，或者是自己有关python不懂的问题，都可以来这里哦 https://jq.qq.com/?_wv=1027&k=s5bZE0K3 这里还有学习资料与免费课程领取

# -*- conding:utf-8 -*-
import requests
from lxml import etree
import time, random, xlwt

# 专家委员会成员的xpath（‘//tbody//tr[@height='29']’）

class Doc_spider(object):

    def __init__(self):
        self.base_url = 'http://www.bjmda.com'
        self.url = 'http://www.bjmda.com/Aboutus/ShowClass.asp?ClassID=12&page={}'
        self.headers = {
   
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'}

    def get_request(self, url):
        '''发送请求，返回html'''
        response = requests.get(url, headers=self.headers).content.decode('gbk')
        # time.sleep(random.random())
        html = etree.HTML(response)