Python
Python相关的文章
请叫我菜鸡
这个作者很懒,什么都没留下…
展开
-
python爬虫学习:爬取CSDN 采用requests + lxml 进行xpath解析 (二)
之前讲了BeautifulSoup 解析页面,今天来看一下xpath解析页面,首先需要安装lxml模块,pip install lxml 代码如下: from lxml import etree import requests # 请求页数数据 def getPage(): print("获取CSDN的页数数据!"); totalPage = 0; url = 'https://blog.csdn.net/h_j_c_123'; headers = {原创 2020-07-30 10:36:16 · 450 阅读 · 0 评论 -
python爬虫学习:爬取CSDN 采用requests + BeautifulSoup (一)
首先需要下载requests库和BeautifulSoup库 pip install requests pip install bs4 代码如下: # requests 模块请求csdn import requests from bs4 import BeautifulSoup import random from lxml import * # 获取一个随机的请求头 # def getUserAgent(): # agent = ''; # list = []; #原创 2020-07-28 23:46:47 · 200 阅读 · 0 评论