爬取简书网

发现文化fu

于 2021-04-05 11:11:28 发布

阅读量120

点赞数

分类专栏： python 简书网 requests 文章标签： xpath selenium url

本文链接：https://blog.csdn.net/weixin_51020254/article/details/115439569

版权

python 同时被 3 个专栏收录

37 篇文章 2 订阅

订阅专栏

简书网

1 篇文章 0 订阅

订阅专栏

requests

1 篇文章 0 订阅

订阅专栏

爬取简书网 requests ，csv

**这里只爬取了一个页面只解析了一个 **

import requests
import pymysql
from lxml import etree

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'}
url = 'https://www.jianshu.com/u/9104ebf5e177?order_by=shared_at&page=3'



def get_url(url):
    resp = requests.get(url,headers=headers)
    print(resp.status_code)
    tree = etree.HTML(resp.text)
    li_list = tree.xpath('//*[@id="list-container"]/ul/li')
    for li in li_list:
        name = li.xpath('./div/a/text()')[0]
        print(name)
get_url(url)

优惠劵

发现文化fu

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬取简书网

爬取简书网 requests ，csv**这里只爬取了一个页面只解析了一个 **import requestsimport pymysqlfrom lxml import etreeheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'}url = 'h
复制链接

扫一扫