LAN_KINGDOM-CSDN博客

原创 AttributeError: module ‘lib‘ has no attribute ‘X509_V_FLAG_CB_ISSUER_CHECK‘

在运行scrapy项目时，一定要保证其他的第三方库版本与在scrapy版本范围内，根据踩过的坑报错一般与cryptography、pyOpenSSL、Twisted这三个库有关，只要把这三个库更新到相应版本即可。

2024-08-03 14:23:06 249

pip install scrapy-fake-useragentDOWNLOADER_MIDDLEWARES = { 'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': None, 'scrapy.downloadermiddlewares.retry.RetryMiddleware': None, 'scrapy_fake_useragent.middleware.RandomUserAgentMiddleware':

2024-07-11 15:07:48 185

原创 Scrapy爬取高清壁纸

用scrapycrawl类爬取壁纸

2024-07-10 13:04:26 718

原创 selenium爬取京东数据（Chrome）

这里就用xpath提取数据就行，但要注意一点就是京东页面跳转有时候会出现数据加载失败，导致数据无法更新，此时要分别定位最上面和最下面的两个重试按钮并点击。每一页的数据可能会爬得不是很全，会少那么几个。那是因为是网站的问题，会有几个商品的数据一直会加载不出来。标题和评论我用了函数式写法，string(.)是获取该标签写的所有内容，因为有些内容不在同一个标签里。原理就是执行JavaScript模拟鼠标滚动。效果如下（只展示了部分数据）

2024-06-29 00:24:52 1862 2