利用python爬取百度贴吧源码

最新推荐文章于 2024-07-30 17:23:09 发布

Jie_Ger

最新推荐文章于 2024-07-30 17:23:09 发布

阅读量570

点赞数 1

分类专栏： python爬虫文章标签： python 爬虫源码

本文链接：https://blog.csdn.net/Jie_Ger/article/details/84308537

版权

import requests

class tieba(object):
    def __init__(self,tieba_name):
        self.tieba_name = tieba_name
        self.start_url = 'https://tieba.baidu.com/f?kw=' + tieba_name + '&ie=utf-8&pn={}'
        self.headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) '
                                     'AppleWebKit/537.36 (KHTML, like Gecko) '
                                     'Chrome/70.0.3538.77 '
                                     'Safari/537.36'}

    def get_url_list(self):
        #构造url列表
        url_list = []
        for i in range(10):
            url_list.append(self.start_url.format(i*50))
        print(url_list)
        return url_list


    def parse_url(self,url):
        response = requests.get(url,headers = self.headers)
        return response.content.decode()


    def save_html(self,html,num):
        with open('英雄联盟贴吧源码

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Jie_Ger

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
利用python爬取百度贴吧源码

import requestsclass tieba(object): def __init__(self,tieba_name): self.tieba_name = tieba_name self.start_url = 'https://tieba.baidu.com/f?kw=' + tieba_name + '&amp;ie=utf-8&amp...
复制链接

扫一扫