爬虫
buhaozhao999
这个作者很懒,什么都没留下…
展开
-
python aes 加盐 加密解密
aes 加盐 加密解密爬虫就是在学习的过程,前几天从某网站的js里学到的加密方式,通过下断点弄清加密原理后,用python复现里以下,在这里和大家分享下#--------引入模块--------from Crypto.Cipher import AESimport base64import timeimport randomfrom hashlib import md5from Crypto.Util.Padding import pad,unpad#--------函数区-------原创 2021-09-24 09:06:31 · 2507 阅读 · 0 评论 -
使用aria2批量下载微博相册
使用aria2批量下载微博相册如题,就是一个简单的微博相册下载器,随便写写,欢迎大家一起交流,代码如下#-------引入模块-------#import requests as resimport timeimport pyaria2import refrom tqdm import tqdmimport os#-------常数区-------##aria2c.exe --enable-rpc --rpc-allow-origin-all win下可以用这条来开启 aria2rp原创 2021-08-29 23:41:03 · 896 阅读 · 0 评论 -
爬虫中常用的正则表达式
爬虫中常用的正则表达式写爬虫的时候,很多时候是需要筛选数据的,可以采用的方法有正则、xpath等,个人比较习惯用正则来筛选,下面给出几个个人比较常用的正则表达式,和大家一起交流下aa(\S+?)bb"\S+"表示筛选非空的字符串,?表示非贪婪模式,根据前后文进行匹配,一般我用它来匹配一些url,这种中间不会出现空格的数据aa(\d+)bb"\d+"表示筛选数字字符串,根据前后文进行匹配,一般用来匹配一下电话号码这类数据aa(\D+)bb"\D+"表示筛选非数字字符串,一般用来匹配一些纯字母的数原创 2021-08-02 21:44:05 · 439 阅读 · 0 评论 -
构造一个自己的115客户端
115网盘登陆、添加离线、删除离线任务、在线播放115网盘mac客户端真的越来越难用了,几次更新,每次更新都比上一次更难用,比如播放器播放不能用,每次关闭浏览器都会自动登出,每次都要重新登陆,于是,我打算自己写个客户端,根据自己常用的功能实现如下功能:1、网盘登陆#------------引入区------------import requestsimport qrcodeimport timeres=requests.session()#------------常数区----------原创 2021-07-09 21:54:56 · 3474 阅读 · 0 评论 -
上海中考分数线爬虫及使用plotly数据可视化
上海中考分数线爬虫及数据可视化马上就中考了,蹭一波热度,做了一个上海市近几年中考分数线对比的爬虫,各区学校对比用了柱状图,各校历年分数线变化用了线形图效果如下:数据来源:微信小程序 升学查分数据获取代码#-----------------引入区-----------------import requestsimport pandas as pdfrom urllib.parse import quote#-----------------常数区-----------------原创 2021-06-16 00:10:54 · 437 阅读 · 0 评论 -
bilibili直播地址获取
一点尝试,获取纯净的播放地址,并使用播放器播放,代码如下#----------------------import-------------------------import requests,osimport easygui as gimport timefrom threading import Thread#----------------------常数区---------------------------res = requests.session()dic={}#---原创 2021-04-25 23:30:24 · 10962 阅读 · 0 评论 -
获取卡通头像
获取卡通头像看到某app可以上传照片获取卡通头像,还可以评价脸型,科学算命,就尝试了一下,不过只写了获取卡通头像的代码,大家共同交流学习import requestsimport easygui as gimport base64from PIL import Image#-----------常数区----------------res=requests.session()a='Ci0tQm91bmRhcnkrMTAyOERDMTcyREE4MUVGNQpDb250ZW50LURpc3B原创 2021-03-17 00:02:12 · 306 阅读 · 0 评论
分享