Python简单实例-爬取CSDN首页侧边栏

在这里插入图片描述声明一下,本人是奋斗的小白一枚~轻喷求大神指点武艺!
在这里插入图片描述
这个全代码,可复制的,第一次写,也不知道咋排版将就看吧!!!
import sys
import requests
import importlib
from lxml import etree

importlib.reload(sys)

def _request(url, encoding=‘utf-8’):
response = requests.get(url)
response.encoding = encoding
html = response.text
return etree.HTML(html)

html = _request(‘https://www.csdn.net/’)

recommend_title = html.xpath("//li[@class=’’]/a/text()")
print(“总共数据:”,len(recommend_title))
for title in recommend_title:
print(title)

搜到的一些关于版本的语法问题,我用的是3.7的
在这里插入图片描述
爬取的CSDN网页源码部分,谷歌浏览器右键查看网页源代码
在这里插入图片描述
关于Xpath,可以看W3school
分享完毕!!!
彩蛋–把爬出的数据写入txt保存
在这里插入图片描述
声明:本文可能涉及部分链接或资料图片来源于互联网,侵权必删!本文只做学习交流,不做任何商业用途!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值