最懂编程的医生
码龄5年
  • 5,579
    被访问
  • 17
    原创
  • 197,606
    排名
  • 5
    粉丝
关注
提问 私信
  • 加入CSDN时间: 2017-11-02
博客简介:

weixin_40901505的博客

查看详细资料
  • 2
    领奖
    总分 111 当月 1
个人成就
  • 获得5次点赞
  • 内容获得7次评论
  • 获得12次收藏
创作历程
  • 16篇
    2021年
  • 1篇
    2019年
成就勋章
TA的专栏
  • 自动化办公
    3篇
  • 爬虫
    10篇
  • 自学Python
    8篇
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

python爬取微信中视频学术会议(m3u8->ts->mp4)

近年来,视频各行各业学术会议百花齐放,有许多会议是基于微信链接的网页的,只要用微信登录,就可以在电脑中播放。只要在电脑中能够播放,无明显加密,就可以用强大的python把视频片段按照次序下载下来,对于有价值的学术视频会议,值得下载于电脑本地,长期保存学习。比如说,有这么一个学术会,把链接转发到微信助手中,在电脑网页中打开;需要扫码的,就扫码登录。点击第一个视频:在抓包调试中找到xhr中的m3u8文件:双击下载到本地,就可以得到:把m3u8改为“txt”,然后用txt程序打开浏览是这样:
原创
发布博客 2021.11.20 ·
377 阅读 ·
0 点赞 ·
0 评论

用you-get多线程批量下载视频片段ts,然后合成mp4,尤其适合会员可回放视频哦……

import osimport threadpool '''用you-get多线程批量下载视频片段ts,然后合成mp4,尤其适合会员可回放视频哦……'''def download(i): try: print('正在多线程下载:',i) # https//v.docbook.com.cn/a30acb0643f74f4086744201430f9319/45a182e637484c13aae7525138b18838-20c73b5d506ab1a81a9
原创
发布博客 2021.11.20 ·
552 阅读 ·
0 点赞 ·
0 评论

python多线程截取音频文件片段,输出指定比特率的mp3文件,很好用

比如,有许多mp3文件,每个文件前都有一段固定时间长度的广告,我想把讨厌的广告批量处理掉,然后在另外一个文件夹内批量的生成指定比特率的mp3文件,我该怎么办?完成后,生成转换后的文件夹。经苦心研究,得出以下程序。来,上才艺!from pydub import AudioSegmentimport osfrom multiprocessing import Pool def worker(filename):###定义工作函数 try: path = r'D:\\桌
原创
发布博客 2021.11.03 ·
194 阅读 ·
0 点赞 ·
0 评论

知乎思维导图半爬虫(含去重、过滤非法字符功能)

知乎思维导图半爬虫(含去重、过滤非法字符功能)import requestsimport reimport osimport timeheaders = {"User-Agent":"Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}def filename_filter(title): ''' windows系统中文件
原创
发布博客 2021.05.26 ·
67 阅读 ·
0 点赞 ·
0 评论

word VBA自动产生绚丽多彩的文字(很好玩儿的功能,亲测有效)

最近在玩儿word VBA,接触一门新的脚本语言,可以让word和excel办公自动化,使办公技能如虎添翼。比如这儿有段文字:在VBA程序窗口中写入以下代码:Sub color_words()Dim n%, cht As RangeFor n = 1 To Selection.Characters.Count ActiveDocument.Characters(n).Font.Fill.ForeColor.RGB = RGB(Rnd * 255, Rnd * 255, Rnd * 255
原创
发布博客 2021.05.15 ·
203 阅读 ·
0 点赞 ·
0 评论

you-get多线程半爬虫(可以下载视频、音频)经典好用!

什么叫“半爬虫”呢?这是我自己给这类小爬虫的命名。比如,有的网站,是动态渲染的,你只需要主页面的部分代码,不需要大动干戈的再用selenium测试一番,只需要在浏览器抓包“检查”中,把需要的代码范围的上一层复制一下,保存在本地txt(utf-8编码)中,然后用本爬虫解析就可以啦!比如,我要下载《小猪佩奇》的241-250集(http://tv.sohu.com/s2015/fhzxm/),就只用把相应范围的代码复制到本地,在用本爬虫解析就行啦!这是本地文件:需要的局部html代码为:<u
原创
发布博客 2021.04.30 ·
280 阅读 ·
0 点赞 ·
1 评论

World中利用宏命令批量删除页眉和页脚(亲测好用!)

Sub 批量删除页眉页脚()'' 批量删除页眉页脚 宏''Dim myDialog As FileDialog, oDoc As Document, oSec As Section Dim oFile As Variant, myRange As Range On Error Resume Next '定义一个文件夹选取对话框 Set myDialog = Application.FileDialog(msoFileDialogFilePicker) Wit
原创
发布博客 2021.04.28 ·
332 阅读 ·
0 点赞 ·
0 评论

用word宏命令批量修改图片尺寸大小(亲测好用!)

wSub setpicsize() '设置图片尺寸Dim n '图片个数On Error Resume Next '忽略错误For n = 1 To ActiveDocument.InlineShapes.Count 'InlineShapes 类型 图片ActiveDocument.InlineShapes(n).Height = 27.31 * 28.35 '设置图片高度为 27.31cm'1cm等于28.35px(像素)ActiveDocument.InlineShapes(
原创
发布博客 2021.04.28 ·
2088 阅读 ·
3 点赞 ·
0 评论

歌谱简谱网的小爬虫,用着贼爽!

歌谱简谱网的乐谱,一个一个下载感兴趣的歌谱图片费时费力,没有效率,很不痛快。干脆弄条爬虫,喜欢哪首乐谱,就把乐谱所在的网址粘贴进去,就行啦,爬虫帮你自动建立文件夹下载到本地,用着贼爽!网站地址:http://www.yidianqiuxun.com具体代码如下:import reimport osimport requests'''使用方法:代码复制到py文件中,保存,关闭,双击键入感兴趣的乐谱网址,即可下载网址主页:http://www.yidianqiuxun.com学到的技能
原创
发布博客 2021.04.21 ·
73 阅读 ·
0 点赞 ·
2 评论

python中定义函数,输出元素最多的列表

有多个列表,如何定义函数,返回所含元素最多的列表(或返回长度最长的列表)。搜遍全网,没有找到现成的,绞尽脑汁,定义了一个函数,有点暴力,不过还挺好用,分享出来。# 定义函数,比较多个列表的长短,并返回最长的列表def max_list(list1,list2,list3): list_all = [list1,list2,list3] max_num = max(len(list1),len(list2),len(list3)) for listx in list_all: if len
原创
发布博客 2021.04.20 ·
142 阅读 ·
0 点赞 ·
0 评论

python创建文件时去掉非法字符

1.函数作用windows系统中文件名不能包含 \ / : * ? " < > |想要创建必须过滤掉这些字符2.函数实现import re def filename_filter(filename): filename = re.sub('[\/:*?"<>|]','',filename) return filename
原创
发布博客 2021.04.19 ·
70 阅读 ·
0 点赞 ·
0 评论

B站多线程爬虫,简单好用

import osimport threadpool '''bilibili 视频批量多线程下载'''def download(i): try: print('正在多线程下载:',i) os.system(r"you-get https://www.bilibili.com/video/BV1ps411F7T7?p=" + str(i)) except: print('error ' + str(i)) name_list =
原创
发布博客 2021.04.15 ·
6 阅读 ·
0 点赞 ·
0 评论

喜马拉雅音频爬虫神器2021年最新版.py

发布资源 2021.03.24 ·
py

公众号文章爬取(马家驹文章)

import requestsimport re'''公众号文章爬取,重要知识点:1.用re.match方法来删除无用的文段。2.不用selenium,而用element复制存为txt文件的办法,来获取临时的网址列表。'''with open('majiaju.txt','r',encoding='utf-8') as file: txt_list = file.readlines() txt_album = ''.join(txt_list) # print(txt) # ..
原创
发布博客 2021.03.12 ·
91 阅读 ·
0 点赞 ·
0 评论

爬取新东方网的某课程答案文本,生成新的html文件

import requestsimport re'''爬取新东方网的某课程答案文本,生成新的html文件,便于在word中编辑。重要知识点:1.万能解码代码2.re.S匹配模式的使用如果不使用re.S参数,则只在每一行内进行匹配,如果一行没有,就换下一行重新开始。而使用re.S参数以后,正则表达式会将这个字符串作为一个整体,在整体中进行匹配。'''url_album = 'https://nce.koolearn.com/20150409/782593.html'headers =
原创
发布博客 2021.03.11 ·
137 阅读 ·
0 点赞 ·
1 评论

爬取百度百科冷僻药物,自动生成简易说明书

用utf-8编码,保存以下冷僻药物到同目录下的txt文件中,双击py文件就可以自动生成简易说明书。巴特日七味丸绿袍散茵陈五苓糖浆脑灵素胶囊槐耳颗粒小儿珠珀散黄藤素软胶囊灭菌结晶磺胺草酸艾司西酞普兰片炔雌醇环丙孕酮片阿昔莫司胶囊苹果酸氯波必利片翘栀牙痛颗粒双环醇片氟米龙滴眼液昆仙胶囊当归龙荟片硒酵母片吡哌酸片汞溴红溶液(红药水)吡诺克辛滴眼液依巴斯汀 美辛唑酮红古豆醇酯栓硫酸羟氯喹片 关节炎骨化三醇胶丸 骨质疏松茴三硫片铝镁二甲硅油片氨糖美辛肠溶片L-
原创
发布博客 2021.03.10 ·
92 阅读 ·
0 点赞 ·
0 评论

懒人听书爬虫(爬到了音频地址,却总是失效,却不成功)

叹服人家的加密做的成功!from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.common.action_chains im
原创
发布博客 2021.03.10 ·
330 阅读 ·
0 点赞 ·
3 评论

用Python制作的文件批量替换、重命名利器,极其好用!

比如test目录下有这几个文件,含有“test123”,如果想更换成demo,怎么办呢?如果文件有1000,10000,怎么快速解决呢?在网上搜索了好些教程,很不好用,既然学了Python,为什么不尝试编写一个呢!秉承着程序猿的懒人精神——Don`t repeat yourself!(拒绝重复!),遂编写了以下Python文件,只要将此文件拷贝到要修改的文件夹下,双击,输入要替换的字符,以及...
原创
发布博客 2019.07.27 ·
247 阅读 ·
1 点赞 ·
0 评论
加载更多