python3 xpath_【学习笔记】Python3-爬虫-xpath

1. 筛选人人影视,迅雷下载地址

//table//td//a[starts-with(@href ,"magnet")]/@href

724874-20200415140949966-356778656.png

2.筛选人人影视页面所有下载地址

//table//td//a/@href

724874-20200415141244446-1995697855.png

3. 筛选 页面标题

//table//td[1]/text()

724874-20200415142543046-1866144261.png

4.筛选深信服桌面云论坛

/html//h4[@class='thread_title-box link']/a[@class='link']/@href

724874-20200415143037257-2020446010.png

5.看雪论坛

/html//a[@class='bbs_home_page_list_title']/@href

724874-20200415143315527-1218746916.png

6.百度搜索结果筛选,去掉广告

//div[@id="content_left"]/div[@class="result c-container "]/h3/a/@href

广告的连接非常长,可以看出结果里面没有广告

724874-20200415145801721-1475637997.png

7.360搜索,去除广告

在360浏览器里,这个xpath插件居然不好使了,嘿嘿嘿。。。..

724874-20200415153018376-866549459.png

更换Google浏览器后,结果正常

//div[@id="main"]/ul/li/h3/a/@href

724874-20200415153147246-2080707945.png

8.CSDN论坛帖子

//a[@class='forums_title title_style_blue title_style_bold']/@href | //a[@class='forums_title ']/@href | //a[@class='forums_title title_style_red title_style_bold']/@href

724874-20200415155122292-1410379944.png

9. freebuf 文章

//div[@class='news-info']/dl/dt/a[1]/@href | //a[@class='article-title']/@href

724874-20200415161308176-574990847.png

10. 百度学术

//h3[@class='t c_font']/a/@href

724874-20200415173548812-755355763.png

详情:

//div[@class="allversion_content"]/span[@class="dl_item_span dl_item_more"]/a/@href | //div[@class="allversion_content"]/span[@class="dl_item_span"]/a/@href

724874-20200415173421541-1993733731.png

***************************** 2020-04-15 更新 ***********************************************

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值