Python爬取网易新闻

最新推荐文章于 2024-05-10 12:36:22 发布

l.l.()

最新推荐文章于 2024-05-10 12:36:22 发布

阅读量545

点赞数 1

分类专栏： pyhton爬虫文章标签： 1024程序员节 python 爬虫

本文链接：https://blog.csdn.net/qq_45931878/article/details/109261077

版权

原题：
在这里插入图片描述
代码

import requests
import re
from lxml import etree
from bs4 import BeautifulSoup
from time import sleep
headers = {
   
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36 Edg/81.0.416.68'
}

def get_text(url):
    res = requests.get(url = url,headers = headers)
    # print(res.text)
    reg = re.compile('"docurl":"(.*?.html)"',re.S)
    finall1 = re.findall(reg,res

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

l.l.()

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Python爬取网易新闻

原题：代码import requestsimport refrom lxml import etreefrom bs4 import BeautifulSoupfrom time import sleepheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36
复制链接

扫一扫