爬虫
浪速之星
这个作者很懒,什么都没留下…
展开
-
b-zhan脚本更新
没办法不能直接打开,只能采用blob的请求格式了。幸好留了一手,除了下载反馈慢了点其他不影响。脚本greasyfork地址。api及参数说明来自。原创 2022-11-02 09:25:36 · 414 阅读 · 0 评论 -
python实现m3u8转mp4
需要用到两个版本的ffmpeg,文件及原码请到项目地址自取https://gitee.com/z2322739526/m3u8主要解决ts改后缀mp4后无法上传网盘播放的问题,所以需要完整处理下tomp4.py费时费电脑,转码速度大约6分钟共处理总计5分钟视频完整代码如下m3u8.pytomp4.py合并mp4.bat...原创 2022-06-27 15:08:08 · 2921 阅读 · 1 评论 -
文章代码更新
b站下载脚本更新往期参考:https://blog.csdn.net/weixin_44476410/article/details/113351342遇到的问题:这样的艺术字标题解码gbk不出来,也不能当做路径使用解决方法:1.try except判断路径是否可用2.不可用则获取当前时间组成文件名# 针对标题不能保存为路径的情况 localtime = time.localtime(time.time())#获取当前时间 tname = time.strft原创 2022-03-10 11:32:01 · 75 阅读 · 0 评论 -
抖音视频无水印下载
抖音视频无水印下载selenium yyds!!!顺便推荐份通过api下载的py我是没找到这api在哪,f12都翻烂了,直接懒人selenium了=_=https://github.com/downdawn/JSreverse/blob/master/%E6%8A%96%E9%9F%B3/dy/parse_video.pyimport requestsfrom selenium import webdriverfrom selenium.webdriver.chrome.options imp原创 2021-08-08 21:41:31 · 309 阅读 · 0 评论 -
b站视频下载更新(加入下载进度)
b站视频下载更新(加入下载进度)一直想加个下载进度进去,最近才搞上顺便加了个获取视频的AV号新开一个pa审核过不了往期相关:Python爬取b站视频(api真实地址)selenium模拟登陆b站参考链接:【python小工具】requests显示下载速度requests 中的参数 streamfrom lxml import etreeimport requestsimport osimport refrom sys import stdoutimport time# 正则原创 2021-07-21 09:17:23 · 12666 阅读 · 1 评论 -
selenium模拟登陆b站
selenium模拟登陆b站工具链接:部分参考链接:b站滑动登陆 ----- こころ~selenium重复执行move by offset时位移值自动累加的问题 ---- vansl大佬的模拟轨迹算法还是很强,但比较看脸登陆成功次数不算多,但至少也算是可以糊弄b站下了本来想获取下自己账号的cookies的,但模拟登录实在有些麻烦,以后有时间在优化优化吧完整代码:import randomfrom PIL import Image, ImageChopsfrom selenium im原创 2021-07-14 14:10:38 · 716 阅读 · 0 评论 -
Python scrapy+selenium实现网易新闻爬取
wangyi.py爬虫文件import scrapyfrom selenium import webdriverfrom wangyipro.items import WangyiproItemclass WangyiSpider(scrapy.Spider): name = 'wangyi' # allowed_domains = ['www.xxx.com'] start_urls = ['https://news.163.com/'] models_urls =原创 2021-03-22 14:38:27 · 413 阅读 · 0 评论 -
Python:selenium登陆12306
云打码平台:超级鹰规避浏览器selenium检测js:stealth.min.js代码参考文章:csdn博主Yi_Kong感谢Yi_Kong博主的文章完整代码(自己输用户名,密码,软件ID)#!/usr/bin/env python# coding:utf-8import requestsfrom hashlib import md5from selenium import webdriverfrom time import sleepfrom PIL import Imagefro原创 2021-03-05 10:53:59 · 98 阅读 · 1 评论 -
教你如何下载斗罗大陆
教你如何下载斗罗大陆仅供学习使用F12获取m3u8文件链接(跳一下视频才会出这个文件)Python,给爷爬import requestsimport reimport osheaders = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36',}m3u8_url =原创 2021-02-20 15:43:00 · 2309 阅读 · 1 评论 -
Python多线程爬虫
Python多线程爬虫需求教程(旧版):bilibili传送门完整代码import requestsfrom lxml import etreeimport reimport osfrom multiprocessing.dummy import Pool# 保存视频def get_video(video_all): print(video_all['title'],'正在下载...') headers = { 'User-Agent':'Mozilla/5原创 2021-02-02 09:03:59 · 194 阅读 · 1 评论