实用
丹尼尔•卡尼�
这个作者很懒,什么都没留下…
展开
-
爬取剧集地址并存入excel
需求以及技术点梳理爬取地址并保存在数据库,后期可放入网站后台调用,最终实现网站在线播放剧集由于数据库以及后台相关知识尚未掌握现暂时练习用爬虫爬取视频地址保存至excel,然后用access存储利用人人视频爬取,因为它的视频url是现成的(不可思议噢)先用selenium爬取,后期合适的话用scrapy全站爬取保存用xlwt模块,后期练习操作excel,争取熟练使用此模块爬取胜者即是正义为例代码#导入模块略def main(): workbook = xlwt.Workbook(e原创 2021-05-16 10:25:20 · 7032 阅读 · 1 评论 -
爬取QQ音乐MV
#获取MV链接import requestsfrom lxml import etreefrom selenium import webdriverimport timeimport reimport osfrom you_get import commonheaders = headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gec原创 2021-04-16 19:20:27 · 506 阅读 · 0 评论 -
pycharm快捷键
PyCharm 之常用快捷(Ps:图片可能显示较慢,请多次点击目录尝试刷新或滚动网页)您是VIP至尊会员,可以直接查看本帖隐藏的内容_编辑类:Ctrl + D 复制选定的区域或行Ctrl + Y 删除选定的行Ctrl + Alt + L 代码格式化(系统自动整理你的代码格式,会更加美观)Ctrl + Alt + O 优化导入(去掉没用到的导入包)Ctrl + 鼠标 打开并查看方法模块中的源码Ctrl + /转载 2021-04-02 16:59:06 · 60 阅读 · 0 评论 -
python操作word转pdf
代码import docximport requestsfrom lxml import etreeimport codecsimport docxfrom docx.shared import RGBColorfrom docx.shared import Inchesfrom docx.shared import Ptfrom docx.enum.text import WD_PARAGRAPH_ALIGNMENT #WD_ALIGN_PARAGRAPH以前的库是这个已经废弃了,如原创 2021-03-20 08:57:29 · 314 阅读 · 0 评论 -
爬虫实践之下载b3u8视频(链接带有blob)
下载blob视频网址http://33.agilestudio.cn/project?id=55211目标视频找到目标网址可以发现网址链接开头是blob,右键下载不下来下面开始尝试用python下载在开发者工具的xhr下面,找到包含videourl字样的文件可以得到m3u8文件的urlm3u8只是视频文件ts路径的封装或者容器,能播放的是m3u8解析下载到本地的一段又一段的ts视频文件。m3u8 文件实质是一个播放列表(playlist)可以下载下来,用记事本打开,可以得到.原创 2021-03-06 20:51:44 · 2539 阅读 · 1 评论 -
少就是多(基础操作)
前言需要操作从txt文件中提取字幕先找个网址把字幕下载下来,srt格式改为txt操作记事本遇到的问题和结果读取第三行with open('步履不停.txt', 'r') as f: list = f.readlines()[2] print(list.strip())读取多行with open('步履不停.txt', 'r') as f: list = f.readlines()[:2] for line in list: print(lin原创 2021-03-03 20:52:54 · 103 阅读 · 1 评论 -
批量修改图片大小
前言备用代码from PIL import Imageimport os.pathimport globdef convertjpg(jpgfile,outdir,width=500,height=500): img=Image.open(jpgfile) try: new_img = img.resize((width, height), Image.BILINEAR) if new_img.mode == 'P': ne原创 2021-02-27 22:12:49 · 166 阅读 · 0 评论 -
爬虫实践之下载豆瓣评论
前言为了生成豆瓣某电影评论词云,需要一个评论文本本次爬取4页短评用的是selenium没有代理池快代码from time import sleepfrom selenium import webdriverbrowser = webdriver.Chrome()browser.get('https://movie.douban.com/subject/25958717/comments?status=P')print("成功打开网页!")comment_list = browser.f原创 2021-02-27 21:57:34 · 140 阅读 · 0 评论 -
脚本学习
前言有一个需求,自动化完成在软件上逐个下载文件的操作,操作仅需鼠标单击想过用软件解决,但是从长远考虑,还是决定学习python自动化操作鼠标、键盘的相关知识pyautogui 模块----操作鼠标pyautogui中文文档操作软件(打开)相关文章...原创 2021-02-26 11:41:19 · 171 阅读 · 0 评论 -
词云和穷爸爸、富爸爸
前言制作词云没什么目的,完全是因为它值得一试提取穷爸爸、富爸爸书中所有文字已有了这本书的文字pdf,因此完全可以直接在pdf上复制以达到目的还有别的方法吗,用python?肯定是有的pdfplumber使用入门制作词云需要库:jieba、matplotlib、Wordcloud...原创 2021-02-25 08:26:48 · 145 阅读 · 0 评论 -
使用百度OCR
前言想利用python做图像文字识别,本来应该挺简单一个事,在csdn逛了好久也没有找到适合自己的做法。现自己实践如下使用百度API(OCR)官方资料:百度API文档只要10分钟 快速掌握文字识别不用postman,直接用python进行接口请求1.获取Access Tokenhost = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=BxtOnsdozbj1wXzg原创 2021-02-24 16:38:42 · 429 阅读 · 1 评论 -
1-16 利用tkinter制作翻译软件
第一步做好模块文件第二步利用cxfreeze打包成exe 使用cxfreeze不顺利,最终直接用quickstart在build文件夹下打包成功 此外发现软件中的图片引用是个坑第三步填坑-------这是个小问题待办第四步改进软件 名称 功能 实用软件制作先放一边,先学习C语言,尽量早日入门另有待办事项 论文 税法[ ]...原创 2021-01-16 18:50:25 · 123 阅读 · 0 评论