![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
IMBAEQ
这个作者很懒,什么都没留下…
展开
-
电脑控制b站app简单小栗子
from appium import webdriverfrom appium.webdriver.extensions.android.nativekey import AndroidKeydesired_caps = { 'platformName': 'Android', # 被测手机是安卓 'platformVersion': '11', # 手机安卓版本 'deviceName': 'xxx', # 设备名,安卓手机可以随意填写 'appPackage': 'tv.danm.原创 2022-01-05 20:43:47 · 169 阅读 · 0 评论 -
随机森林模型
import requestsimport jsonimport prettytable as ptheaders = { 'Cookie': 'pgv_pvid=4227223875; RK=Y0TkAmcewt; ptcz=3a828bb1418fef564dd446864d5d7e6c7562128b5d68f825b464081becb8864e; fqm_pvqid=36f3d133-a426-438a-83d0-1821e340c527; ts_uid=5469654834;.原创 2021-12-30 23:11:45 · 602 阅读 · 1 评论 -
网站抢票案例
from selenium import webdriverfrom time import sleepimport pickle#用于保持和读取cookieimport os#大麦网主页idamai_url='https://www.damai.cn/'#登录login_url='https://passport.damai.cn/login?ru=https%3A%2F%2Fwww.damai.cn%2F'#抢票页面target_url='https://detail.damai..原创 2021-12-29 22:05:28 · 339 阅读 · 2 评论 -
多线程糗事百科爬虫源码,复制即可用
import threading#线程模块import queue#用来队列import requests#便捷性优于urllib模块import timefrom lxml import etree#数据清洗#1采集网页线程class Thread1(threading.Thread): def __init__(self,threadName,pageQueue,dataQueue):#初始化 threading.Thread.__init__(self)#调用threading..原创 2021-12-26 23:24:37 · 450 阅读 · 0 评论 -
自制英语翻译(调用有道翻译接口)
import urllibfrom urllib import requestimport timeimport reimport requests#构造请求头信息header={"User-Agent":"Mozilla/5.0 (Linux; U; An\droid 8.1.0; zh-cn; BLA-AL00 Build/HUAW\EIBLA-AL00) AppleWebKit/537.36 (KHTML, l\ike Gecko) Version/4.0 Chrome/57..原创 2021-12-16 22:25:12 · 156 阅读 · 0 评论 -
音乐数据爬取
import requestsimport reimport pprintheader={"cookie": 'P_INFO=wjj2578759459@126.com|1632748549|1|mail126|00&99|null&null&n\ull#zhj&330100#10#0#0|&0||wjj2578759459@126.com; _iuqxldmzr_=32; _ntes_nnid=be781951ec2\be2656956fbf83bd73.原创 2021-12-15 21:23:24 · 213 阅读 · 0 评论 -
多线程糗事百科案例,直接可用,注释明确
port threading#线程模块import queue#用来队列import requests#便捷性优于urllib模块import timefrom lxml import etree#数据清洗#1采集网页线程class Thread1(threading.Thread): def __init__(self,threadName,pageQueue,dataQueue):#初始化 threading.Thread.__init__(self)#调用threading.Th.原创 2021-11-28 08:43:34 · 442 阅读 · 0 评论 -
双十一刚过,写了一个selenium爬取淘宝商品信息的爬虫
几与selenium的自动化淘宝爬虫原创 2021-11-26 23:28:48 · 681 阅读 · 1 评论 -
2021-10-19,基于百度贴吧的面向对象的图片爬虫
import urllibimport urllib.requestfrom lxml import etreeimport timeimport randomclass Spider():#爬虫类 def __init__(self):#初始化 self.tiebaName=input("请输入贴吧名:") self.beginPage=int(input("请输入起始页:")) self.endPage=int(input("请输入终...原创 2021-10-19 10:19:35 · 83 阅读 · 0 评论