![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
习惯了一个人面对所有
这个作者很懒,什么都没留下…
展开
-
12306抢票一(登录)
12306抢票一(登录)找到登录的页面,由于账号密码登录比较麻烦就直接扫码登录所以要先找到登录页面的url,利用selenium进行登录。在实战中一般要先把框架给搭好,好后面添加代码。为了代码得简洁,可读性较高,所以整个过程在一个类中实现,类中又定义了不同的函数来实现不同的功能搭框架:有一个执行的入口,有一个主函数可以调用定义的类。class TrainSpider(object): def __init__(self, *args, **kwargs) pass def run(self原创 2020-09-22 13:23:20 · 433 阅读 · 0 评论 -
多线程爬取段子
使用多线程爬取段子请求网页响应获取源码由于使用多线程代码比较多,所以定义一个采集类class CrawlThread(threading.Thread): def __init__(self, name, url_queue, data_queue): super(CrawlThread, self).__init__() self.name = name self.url_queue = url_queue self.data_原创 2020-09-20 22:56:33 · 173 阅读 · 0 评论 -
多线程爬取王者荣耀游戏壁纸
多线程爬取王者荣耀游戏壁纸https://pvp.qq.com/web201605/wallpaper.shtml王者荣耀游戏壁纸的下载页面右键检查但是在网页源代码里找不到壁纸的链接这个文件是还需要进行一个解码操作,再提取壁纸的下载链接进行多线程爬虫时,把生产者和消费者各自创建一个类这个类要继承threading.Thread类还要写入run方法,类中需要传入参数需要重写父类的__init__()方法使用队列需要定义用到的队列1.定义生产者类class Producer原创 2020-09-18 17:37:06 · 856 阅读 · 0 评论 -
from sklearn.linear_model import RandomizedLogisticRegression as RLR导入报错
遇到的问题:from sklearn.linear_model import RandomizedLogisticRegression as RLR导入报错from sklearn.linear_model import RandomizedLogisticRegression as RLRImportError: cannot import name ‘RandomizedLogisticRegression’ from ‘sklearn.linear_model’ (D:\anaconda\li原创 2020-06-19 14:20:07 · 6662 阅读 · 10 评论