
python
奋斗吧-皮卡丘
我的B站(可以放松一下):https://space.bilibili.com/391953214
我的第一个个人博客:https://zhaojiafu.github.io/
保持好奇心,开始养成记录学习笔记的习惯吧,加油!!!喜欢听音乐,热爱技术。
【我坚信:学习中遇到问题时,要习惯于多思考,根据已经掌握的知识举一反三;搞不懂的,可以使用Google搜索引擎,大部分常见的问题都会有答案;遇到问题不论大小马上就去请教“高手”不是明智之举,自己研究出来的答案远比你从“高手”那里得到的现成答案要记忆深刻,也更有利于你今后的学习。希望自己成为高手的人,从不会放弃自己独立思考问题的机会。】
-
原创 python3 解决&#开头的Unicode编码的字符串问题的通用方法
文章目录需求:解决步骤:1、安装HTMLParser模块:2、解决报错:ModuleNotFoundError: No module named 'markupbase'需求:如果有一串字符串,含有&#的特殊字符串,如何解决,我尝试之后,放入html页面中,使用浏览器打开是正常的。最后搜到了一篇文章:https://blog.csdn.net/WindyQCF/article/details/71435145然后我就想着用HTMLParser模块,结果各种报错,最终还是解决了。解决步骤:2021-04-15 13:19:3521
0
-
原创 pytho3 提取pdf文件的文本内容
文章目录1、安装模块:2、代码提取pdf文件1、安装模块:pip install pdfminer3k2、代码提取pdf文件# pip install pdfminer3kfrom pdfminer.pdfparser import PDFParser, PDFDocumentfrom pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter, PDFTextExtractionNotAllowedfrom pdfmi2021-03-29 18:37:2727
0
-
原创 python 将图片字节 与PIL的Image 互相转化
文章目录需求:1、图片字节转换成image对象2、image对象转换成图片字节需求:比如我请求返回一个图片字节,想直接转换成PIL的image对象。或者PIL打开本地图片,进行一系列改变大小尺寸,或者转换成RGB之后,再将image对象转换成图片字节如何来搞。1、图片字节转换成image对象# 图片字节转换成image对象from io import BytesIOfrom PIL import Imageimg_byte = b"图片字节"bytes_stream = BytesIO(2021-03-17 09:09:0937
0
-
原创 centos 安装pip3 install psutil 的问题: error: command ‘gcc‘ failed with exit status 1
文章目录安装命令:安装命令:解决方法:先安装Python3 需要的环境:yum install gcc libffi-devel python3-devel openssl-devel -y合并一起:yes y|yum install gcc libffi-devel python3-devel openssl-devel -y;yes y|pip3 install psutil如果是Python2版本的:yes y|yum install gcc libffi-devel python2021-02-04 17:33:0086
0
-
原创 python批量解压rar和zip的压缩包
文章目录一、学习目标:1、安装模块:2、rarfile.RarCannotExec: Cannot find working tool问题:3、批量解压代码:一、学习目标:批量解压一个目录下的所有rar和zip的压缩包。之前只是解压zip,今天想解压的里面也有rar,奈何之前脚本跑不了,然后就优化了下。我之前的俩篇博客:python 解压zip压缩文件,并且还原中文文件名乱码问题python对window对一个目录下的所有子目录批量压缩1、安装模块:pip install rarfile2021-01-26 22:08:39178
0
-
原创 python 之jupyter 学习3--快捷键整理【后续有的话也会增加到这里】
文章目录一、学习目标:二、快捷键整理【后续用到会持续更新】1、jupyter notebook快速切换code和markdown2、代码模式下补充3、更多快捷键:一、学习目标:整理收集jupyter常用的快捷键。二、快捷键整理【后续用到会持续更新】1、jupyter notebook快速切换code和markdownEsc + M:切换至Markdown模式Esc + Y:切换至代码模式2、代码模式下补充tab键 可以补充比如:输入im之后,可以按tab键,会不提示,快速写代码。3、更2021-01-09 22:35:51230
0
-
原创 python永久设置pip的国内源的快捷方式
文章目录学习目标:设置方法:个别失败情况解决方法:学习目标:不知道熟悉python的你是否很烦每次安装模块都要去找国内源,然后安装,发现那个方法太麻烦了,其实可以永久设置指定的国内源的,以后不用再去找国内源么设置方法:简单粗暴,直接上代码:# 永久設置阿里云的国内源【如果是阿里云的ecs,推荐使用】pip config set global.trusted-host mirrors.aliyun.compip config set global.index-url https://mirror2021-01-09 12:10:54147
0
-
原创 jupyter 学习之2-修改工作路径2
文章目录一、学习目标:二、我的再次解决方法:1、我的配置:2、安装:3、建立jupyter快捷方式:4、执行jupyter快捷方式:5、生成配置文件:6、修改c.NotebookApp.notebook_dir的地址:7、重启jupyter:一、学习目标:其实之前整理过一次安装:jupyter 学习之1-修改工作路径但是呐,现在使用之前的命令安装,之后,因为是家里的电脑,之前是公司电脑安装,是有用户名的,能找到位置,发现现在无法找到jupyter_notebook_config这个文件了。所以只能在2021-01-09 00:03:1948
0
-
原创 lxml模块对xpath定位的元素进行转HTML源码
文章目录需求:方法1:使用from lxml.html import tostring的tostring方法功能方法2(推荐使用,经过我效率测试,使用etree返回的html使用xpath定位到的元素,还使用etree转换为HTML源码效率更快):需求:如何将xpath定位到的元素进行转为HTML源码方法1:使用from lxml.html import tostring的tostring方...2019-07-18 09:41:05935
2
-
原创 python将多张图片合并成一张图片
文章目录说明:合并图片的三个过程1、参考原博主的:2、优化第一个数量问题:3、优化俩个问题(数量不限+性状按比例变小)说明:今天想着把图片如何合并成一张图片,然后我就搜到了一篇博客,博主写的很好,我仔细看了,还能用,就是效果不太好(就是原图的形状比例变了,看着很不爽),然后我重新优化了下。合并图片的三个过程1、参考原博主的:参考博文地址import osimport PIL.Ima...2020-01-17 15:02:209221
11
-
原创 python 安装PIL模块,并且查看图片大小
文章目录1、安装PIL(pip install Pillow)2、使用python查看图片大小2.1 爬取图片的响应字节,查看图片大小(个人项目需求)2.2 使用os模块查看本地文件的大小(包括但不限图片)1、安装PIL(pip install Pillow)图片是我第一次安装命令错误,后来才发现是pip install Pillow但是导入模块使用是PIL:from PIL impo...2019-07-19 10:19:34916
0
-
原创 python Windows 下配置虚拟环境
文章目录说明:1、安装模块virtualenv2、为项目安装虚拟环境3、启动虚拟环境3.1、可以直接在刚刚命令下使用方法2:添加刚刚的虚拟环境的Scripts到环境变量中3、退出、deactivate说明:虚拟环境有时候项目不同,可以需要不同的模块版本,这个时候就需要这个虚拟环境了,但是,我之前弄了很多次就没有成功,这一次参考一个博客就成功了,我也很纳闷。不管了,先记录下来,剩下下次再不会了。...2019-07-24 12:21:09114
0
-
原创 pyinstaller 打包python文件成exe
文章目录说明:本文主要是在b站上面看到一个打包成exe的简单小程序,然后想着把我的之前做过的项目程序打包成试试,然后把子自己的成功过程记录下来,后续如果遇到相关知识再来扩展博客。注意事项1:注意事项2:1、使用安装pyinstaller2、使用pyinstaller 打包单个py程序文件3、使用pyinstaller 打包多个py程序文件说明:本文主要是在b站上面看到一个打包成exe的简单小程序...2019-07-13 11:48:17447
0
-
原创 python3之time模块的时间戳转换(日期格式转为时间戳、时间戳转化为日期格式字符串)
文章目录1、日期格式转为时间戳2、日期格式转化为时间戳1、日期格式转为时间戳import time# 将如上的时间2019-05-20 5:21:00转换成时间戳,具体的操作过程为:# 利用strptime()函数将时间转换成时间数组# 利用mktime()函数将时间数组转换成时间戳dt = "2019-05-20 5:21:00"#转换成时间数组timeArray = time....2019-05-20 15:08:591867
0
-
原创 FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version
文章目录问题:解决方法:今天测试了一个大牛的去除图片马赛克的代码除了不少的错误,这个十个警告,能完成去重的效果,但是看着警告感觉不爽,所以接着寻找解决办法:问题:FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version of numpy, it wil...2019-08-02 12:25:0215602
9
-
原创 np.c_和np.r_
demoimport numpy as npa = np.array([1, 2, 3])b = np.array([4, 5, 6])c = np.c_[a,b]print(np.r_[a,b])print(c)print(np.c_[b,c])结果[1 2 3 4 5 6][[1 4] [2 5] [3 6]][[4 1 4] [5 2 5] [6 3 6]]...2019-04-08 14:57:3541
0
-
原创 python 对列表排序之高级模块natsort
文章目录说明一、安装pip install natsort二、简单使用1(数字类型的字符串排序)1、不用模块方法2、使用模块方法:三、英文小写(单个大写也一样)+ 数字三、英文大小写 +数字说明工作中有时候总会遇到一些功能,比如排序,要么就自己写一个排序函数,这时候如果这个模块就可以使用了,可以大大的提高你的效率,节省你的时间。比如需要合并视频时,或者对文件夹下面的文件进行操作需要进行排序时。...2019-07-08 16:56:45780
0
-
原创 正则匹配文本时几个很重要的用法
文章目录1、除了:2、中文:3、匹配中文和中文标点符号:1、除了:比如,除了数字都匹配:'[^\d]'解释,\d代表数字,前面带个^就是代表除了后面的字符。2、中文:这个能匹配任意一个中文汉字'[\u4e00-\u9fa5]'使用场所,如果需要提取一个文本中的汉字,可以使用。3、匹配中文和中文标点符号:能匹配任意一个中文汉字或者标点符号。'[^\x00-\xff]'如...2019-11-18 17:49:0076
0
-
原创 python json格式化保错的另一种处理方式
文章目录1、找到报错的原因2、使用正则替换掉不需要的字符1、找到报错的原因一般是有些字符或者编码无法识别,这时候需要保存成txt文件进行查找分析,具体在哪个位置。找到相关字符进行分析。2、使用正则替换掉不需要的字符比如我的是借助python的正则表达式,匹配的字符串中,我只要含有中文,英文、数字、还有:"’<>\/-,{} 这些字符需要,其他的我都认为是json报错的字符,替...2019-07-02 18:57:29300
0
-
转载 正则表达式-匹配中英文、字母和数字
最近需要用到正则匹配,上网找了一下,发现这个博客写的不错,想着保留了下载,日后用时就省事了。转载来自:https://blog.csdn.net/jinruoyanxu/article/details/79385815在做项目的过程中,使用正则表达式来匹配一段文本中的特定种类字符,是比较常用的一种方式,下面是对常用的正则匹配做了一个归纳整理。匹配中文:[\u4e00-\u9fa5]英...2019-03-21 11:31:5110075
0
-
原创 python汉字转成拼音、英文的一个学习随笔
文章目录一、说明:二、简单使用:1、汉字转拼音:2、汉字转英文(不能转换一个句子,如果是句子会先切分开再进行一个一个翻译,返回列表)一、说明:这个是我发现一个python好用的一个模块,名字就是pinyin:主要功能就是基于普通话将汉字翻译成拼音。模块地址:安装命令:pip install pinyin二、简单使用:解释我放在代码里面了,看看就懂了,不过多解释了。1、汉字转拼音...2019-11-05 09:53:29696
0
-
原创 整理最全的 python 之markdown与HTML的互转的几个模块
文章目录一、说明:二、互转模块:1、md转html①、markdown模块(推荐):②、md-to-html模块(不推荐):2、html转md:①、tomd模块:②、html2text文件(推荐):③、html2markdown模块:一、说明:今天突然想着学习一下如何将markdown和HTML互转的知识,因为我在CSDN的写的博客可以导出的时候有俩种方式,所以想着也可以把他们相互转化下。我觉...2019-11-28 12:54:10998
0
-
原创 python sentry监控系统的简单使用
文章目录一、注册账号:1、能创建多个项目:2、接收的监控:二、安装模块三、简单使用:1、简单测试1:报警:2、下面我模仿一个爬虫失败的监控:一、注册账号:注册地址进入之后使用邮箱注册,我使用QQ邮箱注册就能使用。注册成功之后,会跳转让选择语言界面,我这里选择python:我的跳转后地址:(https://sentry.io/onboarding/b4754e1b71/get-star...2019-12-05 10:26:331169
2
-
原创 python执行系统命令的方法总结
文章目录说明:三个python执行系统命令的方法:1、os.system()2、os.popen()3、subprocess.Popen()4、如何让subprocess.Popen()和os.popen()等待5、总结:说明:python 将html保存为PDF之一个学习笔记今天转存HTML为pdf的时候,然后我使用os.system时候出现问题,后来网上搜索python有三种执行命令,结...2019-10-24 17:26:15485
0
-
原创 python 下json转xml、html,xml转json
文章目录一、说明:二、简单操作使用:1、json转xml:①、安装:②、代码中的josn③、代码:2、json转html:①、安装:②、代码:3、xml转json:①、安装:②、代码:③、去掉属性:4、html转json(暂时没有解决)一、说明:今天突然有个想法,吧json转化为xml和html然后就搜索,真的找到了相关的一些模块,既然有了模块,就找到几个简单的实例做个示范。但是有一个我测试...2019-12-11 11:03:521369
0
-
原创 安装Twisted 报错:Microsoft Visual C++ 14.0 is required。。。
文章目录1、需求,安装Twisted报错2、解决方法2.1、下载对应版本的模块2.2、安装即可:1、需求,安装Twisted报错Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": https://visualstudio.microsoft.com/downloads/...2019-07-24 12:58:14182
0
-
原创 python对list中json(可多层下的字段值)的字段进行排序模块operator
文章目录一、说明:二、使用案例:0、官方中文文档:1、更新对json进行排序:2、对多层下的json字段值进行排序(`需要排序的字段层级取值必须是确定的`)一、说明:之前学习一个排序,翻了半天才找到代码,感觉挺耽误时间的,所以记录下来,方便日后再需要,毕竟好记性不如烂笔头,何况我记性也不太好。。。。二、使用案例:后面如果用到更多的关于operator模块的用法,我会持续更新的。0、官方中文文档:地址:1、更新对json进行排序:直接上代码:data_list = [{2020-08-27 17:53:07284
0
-
原创 python 将PDF 转成 图片的几种方法
文章目录一、说明二、PDF转图片方法1:PyMuPDF①、安装PyMuPDF:②、转换图片代码:方法2:pdf2image①、安装pdf2image②、安装Poppler:一、说明昨天突然想着把PDF转成图片,昨天尝试了许久,没有成功,然后就很纳闷,图片合成PDF就可以,应该转成图片也可以吧,然后网上各种找解决这个问题的方法。如果需要图片合成PDF的,可以参考一下我之前的一个博客:使用im...2019-12-26 17:09:293660
3
-
原创 python 将html保存为PDF之一个学习笔记
文章目录说明:一、环境配置:1、window的wkhtmltopdf下载地址==记得安装好把安装位置的bin目录放到环境变量中。==2、安装pdfkit模块:二、代码实现:方法1--wkhtmltopdf命令url :方法2--wkhtmltopdf命令html:方法3--pdfkit的from_url(url这个不报错):注意点:代码演示:方法4--pdfkit的from_file(我的虽然也能...2019-10-24 15:39:01877
0
-
原创 python 使用twilio进行发短信
文章目录1、说明:2、开始注册账号:1、官网:https://www.twilio.com/2、寻找python的使用案例demo注意一点,我收到短信的手机号和我申请成功的手机号不是同一个,不知道什么原因谷歌平台隐藏了。1、说明:这个主意我还是看到一个公众号,然后有说可以发短信,然后就搜索了一下,确实有这些第三方平台,好像可以免费用一定次数,因为注册后送了15美元,我只是测试,目前还没有过多使...2019-08-12 14:54:08494
0
-
原创 python pytube模块运行报错:from pytube.compat import quote ImportError: cannot import name ‘quote‘
文章目录一、说明:解决思路:1、谷歌搜索:2、慢慢查找解决方法:一、说明:今天使用pytube模块下载YouTube视频的时候发现报错,但是之前使用是没有问题的,最后在pytube项目下的issue里面找到一个回答解决。报错内容:from pytube.compat import quote ImportError: cannot import name 'quote'解决思路:1、谷歌搜索:将错误的最后俩句放到谷歌或者百度搜索。from pytube.compat import quot2020-08-25 17:07:06376
0
-
原创 使用python将doc的word文件转换成docx文件
文章目录一、学习目标:二、直接转换代码:一、学习目标:主要之前使用python提起word的docx的文件的数据。但是今天发现,如果是doc后缀的word文件,会报错,这样就无法提取数据了,然后开始搜索如果使用python将doc抓换成docx文件。发现好多文章都是使用win32com模块处理的。二、直接转换代码:不多说了了,直接上我整理测试成功的代码:from win32com import client as wc #导入模块def doc_to_docx(file): word2020-09-10 14:47:561668
0
-
原创 python提取docx文档的信息(文本+表格)
文章目录一、说明:二、提取数据安装模块:1、提取文本内容:2、提取Excel表格内容:一、说明:本文的需求是提取docx文档里面的数据信息,包括文本和Excel表格信息。经过一上午的搜索,目前找到了一些文字,整理成自己需要的的代码。二、提取数据安装模块:我这里直接命令安装即可。pip install python-docx1、提取文本内容:这里只有按原的每行保存为一个大的字符串。具体不废话了,直接上代码:import docxdef extract_docx_text(docFi2020-08-26 11:11:171655
0
-
原创 pyspider学习之---- windows安装pyspider模块
文章目录一、学习目标:二、安装步骤:0、scrapy和pyspider对比1、安装python3.5版本的python2、安装pyspider模块:3、在cmd中输入pyspdier:4、pycurl模块安装:5、最后,cmd执行:`pyspider`6、pyspider的官方使用文档和GitHub参考:一、学习目标:今天突然想安装下pyspider,一个python爬虫框架,但是发现我的python3.7安装不了,然后看了下pyspider模块,发现最大支持是python3.5,所以我就再安装一个py2020-10-23 16:25:21220
0
-
原创 centos 上如何使用python将doc转docx
文章目录一、学习目标:二、具体步骤:1、参考2、安装3、执行命令一、学习目标:上一篇刚学习了使用python将doc转docx,发展这个模块只能window使用,但是代码迁移到ecs上,如果报错。历经搜索无数文章,总算找到了一个救星。参考文章二、具体步骤:1、参考https://stackoverflow.com/questions/52277264/convert-doc-to-docx-using-soffice-not-working2、安装yum remove openoffice2020-09-10 16:49:58242
0
-
原创 python 解压zip压缩文件,并且还原中文文件名乱码问题
文章目录一、需求二、不多说,直接上代码:1、解决一个压缩包的代码:2、自动化下载一个压缩包并解压:一、需求如果我有一个压缩包需要解压,使用python可以自动化解压,最后又遇到如果解决的含有中文会乱码,需要根据情况把文件名还原。二、不多说,直接上代码:1、解决一个压缩包的代码:import zipfileimport osfrom pathlib import Pathdef unzip_file(file_zip_path): new_zip_dir = file_zip_pat2020-09-07 11:57:12702
0
-
原创 python 将JS(JavaScript)的json格式字符串转换为python的字典格式
文章目录1、需求:2、如何将js的json转python字典1、需求:比如我从js的字符串中提取出JavaScript的json字符串,然后找到一个很好的模块。demjson:但是我的电脑,今天不知为何,pip安装各种失败,不过还好,使用python直接安装解压包成功了。2、如何将js的json转python字典其实使用这个模块,很简单。安装 模块命令;pip install demjson转换代码:其实很简单import demjsonjs_json_str = '{x:1, y2020-09-04 17:57:57463
0
-
原创 python提取excel表格数据
文章目录一、说明:二、带着我发现的来个问题,寻找解决方法:0、安装模块`xlrd`1、解决哪一行是开始的行的问题:2、解决,表格中有合并单元格的问题:3、结合1和2的问题解决,弄个自动化识别开始数据的行并且提取数据。一、说明:今天需要提取Excel表格数据,但是之前没有弄过,然后找到了xlrd模块,但是有个来个问题需要解决:1、如果Excel表格数据过多,如何判断第一行从何处开始读取Excel数据。2、如果Excel表格中有合并表格,不能直接一行一行读取数据,不然就会有合并区域(除了坐上去的单元格,2020-08-26 15:26:21735
0
-
原创 centos 系统版本的linux 安装gevent模块报错:error: command 'gcc' failed with exit status 1
文章目录1、报错内容解决方法:方法1:方法2:1、报错内容解决方法:方法1:我找到一些方法(但是不适用我的):yum install libevent-develyum install python develyum install python-gevent安装之后再进行安装gevent模块,但是我的失败了。方法2:我感觉可能是现在最新版本的不是我的centos系统,因...2020-04-16 11:50:01485
0
-
原创 python对window对一个目录下的所有子目录批量压缩
import zipfileimport osdef zip_yasuo(start_dir): file_news = start_dir + '.zip' if not os.path.isfile(file_news): z = zipfile.ZipFile(file_news, 'w', zipfile.ZIP_DEFLATED) f...2020-05-01 15:26:43188
0