- 博客(1)
- 收藏
- 关注
原创 pdf文件中特定词语筛选
对于pdf文件中的文字进行筛选并计数,文件量太大,且文件内容太多,用python编程实现,前部分是网上找到的pdf读取模块,后部分关键词根据需要进行变动即可。 ps:表中出现的是特定字符串的索引值,没出现的是-1,如果需要出现了记录1,没出现记录0可以使用df.replace(-1,0),df.mask(df != 0,1)这两句。 #!/usr/bin/env python # -*- coding: utf-8 -*- from pdfminer.pdfparser import PDFPar..
2022-05-01 14:58:47 1175
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人