声明一下,本人是奋斗的小白一枚~轻喷求大神指点武艺!
这个全代码,可复制的,第一次写,也不知道咋排版将就看吧!!!
import sys
import requests
import importlib
from lxml import etree
importlib.reload(sys)
def _request(url, encoding=‘utf-8’):
response = requests.get(url)
response.encoding = encoding
html = response.text
return etree.HTML(html)
html = _request(‘https://www.csdn.net/’)
recommend_title = html.xpath("//li[@class=’’]/a/text()")
print(“总共数据:”,len(recommend_title))
for title in recommend_title:
print(title)
搜到的一些关于版本的语法问题,我用的是3.7的
爬取的CSDN网页源码部分,谷歌浏览器右键查看网页源代码
关于Xpath,可以看W3school
分享完毕!!!
彩蛋–把爬出的数据写入txt保存
声明:本文可能涉及部分链接或资料图片来源于互联网,侵权必删!本文只做学习交流,不做任何商业用途!