网络爬虫-lxml实践

lxml所需的知识点:

1.python基础是必须的;

2.网页的审查元素(快捷键F12),了解网页结构;

3.xpath语法,相关内容可查阅csdn或者直接百度。

代码,自测可用(需要安装requests库,lxml库)


# -*- coding : utf-8 -*-
#注意:此段代码,仅限学习交流使用

import requests
from lxml import etree
import time


headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36',
    #这个是个人cookie,登录自己账号时,请替换
    'Cookie':'antipas=18148a4j1k55Qy16346M370; uuid=a4c73efd-c5eb-4235-d0da-ccf826720024; ganji_uuid=2249827056567416173723; lg=1; financeCityDomain=sjz; a4c73efd-c5eb-4235-d0da-ccf826720024_views=1; 424719c5-85c6-42a5-ec46-c46b76518b72_views=1; Hm_lvt_e6e64ec34653ff98b12aab73ad895002=1591934543; Hm_lvt_936a6d5df3f3d309bda39e92da3dd52f=1591934529,1591934556; cityDoma
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值