- 博客(2)
- 收藏
- 关注
转载 Python 正则表达式匹配不同语言文字(区分中文等)
正则表达式说明函数 说明 sub(pattern,repl,string) 把字符串中的所有匹配表达式pattern中的地方替换成repl [^**] 表示不匹配此字符集中的任何一个字符 \u4e00-\u9fa5 汉字的unicode范围 \u0030-\u0039 数字的unicode范围 \u0041-\u005a 大写字母unicode范围 \u0061-\u007a 小写字母unicode范围 \uAC00-\uD7AF
2021-06-27 12:40:11 741
原创 Python pdfminer PDF转txt 最新可运行代码
import importlibimport sysimport timefrom pdfminer.pdfparser import PDFParserfrom pdfminer.pdfdocument import PDFDocumentfrom pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreterfrom pdfminer.converter import PDFPageAggregatorfrom pdfm.
2021-06-14 13:52:46 447 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人