xpath爬取首页信息,并获取详情页标题与时间

最新推荐文章于 2024-06-06 15:13:26 发布

han_yanlong

最新推荐文章于 2024-06-06 15:13:26 发布

阅读量4.9k

点赞数

文章标签： python 爬虫 xpath random

本文链接：https://blog.csdn.net/han_yanlong/article/details/76919000

版权

# -*- coding: utf-8 -*-
# url为 伯乐在线文章首页
import sys
import requests
from lxml import etree
import random
import codecs
reload(sys)
sys.setdefaultencoding("utf-8")
def download_page(url):
    user_agent_list = [
        "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:54.0) Gecko/20100101 Firefox/54.0",
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36 OPR/26.0.1656.60",
        "Mozilla/5.0 (Windows NT 5.1; U; en; rv:1.8.1) Gecko/20061208 Firefox/2.0.0 Opera 9.50",

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

han_yanlong

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
xpath爬取首页信息,并获取详情页标题与时间

# -*- coding: utf-8 -*-# url为伯乐在线文章首页import sysimport requestsfrom lxml import etreeimport randomimport codecsreload(sys)sys.setdefaultencoding("utf-8")def download_page(url): user_age
复制链接

扫一扫