python
喜欢地上爬的孩子
这个作者很懒,什么都没留下…
展开
-
学习Transformer进度一
transformer原创 2022-06-16 21:36:56 · 505 阅读 · 0 评论 -
python-LAC使用方法的相关总结
代码如下:from LAC import LAC# 分词的功能def fenci(): # 装载分词模型 lac = LAC(mode='seg') # 单个样本输入,输入为Unicode编码的字符串 text = u"LAC是个优秀的分词工具" seg_result = lac.run(text) print(seg_result) # 批量样本输入, 输入为多个句子组成的list,平均速率会更快 texts = [u"LAC是个原创 2021-12-01 09:38:36 · 2610 阅读 · 0 评论 -
python直接获取pdf图片的时候,报错:doc._getXrefLength和doc.getObjectString(i)
将其进行修改:fitz 库 安装的不是pip install fitz 而是 pip install pymupdf报错AttributeError: ‘Document’ object has no attribute ‘_getXrefLength’ REF = doc._getXrefLength()改成 REF = doc.xref_length()定义对象字符串 taxt = doc.getObjectString(i)改成 text = doc.xref_原创 2021-11-30 16:18:10 · 5125 阅读 · 1 评论 -
python提取pdf中的所有图表
1、将我们的pdf转换成图片: def main(self, pic_path, cropped_pic_path, pgn=None): """ 主函数 :param pic_path: 被截取的图片路径 :param cropped_pic_path: 图片的截图的保存路径 :param pgn: 指定获取截图的对象的索引 :return: """ if pgn is原创 2021-11-29 15:33:13 · 1200 阅读 · 0 评论 -
python提取pdf中的图片-版本一
具体代码如下:import fitzdef func(doc): for i in range(len(doc)): imglist = doc.getPageImageList(i) for j, img in enumerate(imglist): xref = img[0] pix = fitz.Pixmap(doc, xref) # make pixmap from image原创 2021-11-28 11:52:43 · 491 阅读 · 0 评论 -
蓝桥杯BASIC-10。十进制转十六进制(python)
代码如下:(如有不懂可以私聊)if __name__ == '__main__': num = input() str1 = str(hex(int(num,10))[2:]) print(str1.upper())原创 2021-11-27 20:08:16 · 276 阅读 · 0 评论 -
蓝桥杯BASIC-11。十六进制转十进制(python)
如下:(如有不懂可以私聊)if __name__ == '__main__': num = input() print(int(num,16))原创 2021-11-27 20:07:13 · 337 阅读 · 0 评论 -
蓝桥杯BASIC-12。十六进制转八进制(python)
代码如下:(如有不懂可以私聊)if __name__ == '__main__': n = int(input()) for i in range(n): a = input() print(oct(int(a, 16))[2:])"""进制转换函数:2-8、10、16oct(int(n,2))、int(n,2)、hex(int(n,2 ))依次类似"""...原创 2021-11-27 20:05:59 · 216 阅读 · 0 评论 -
蓝桥杯BASIC-13。数列排序(python)
代码如下:(如有不懂可以私聊)def paixu(num,num2): array = input().split(" ") array = list(map(int, array[0:-1])) array.sort(reverse=False) for i in range(num): print(array[i],end="") print(" ",end="")if __name__ == '__main__': num原创 2021-11-27 20:04:46 · 216 阅读 · 0 评论 -
蓝桥杯BASIC-01。A+B问题(python)
代码如下:(如有不懂可以私聊)def function1(num1,num2): print(int(num1)+int(num2))if __name__ == '__main__': num = input() num1,num2 = num.split(" ") function1(num1,num2)原创 2021-11-27 20:03:16 · 80 阅读 · 0 评论 -
王老师经验分享
1、应该找的东西:寻找一级期刊的文章:软件学报、计算机学报2、解析的内容:1、(1-2针对摘要进行解析)1、问题的背景、做什么(完成了什么)、对作品的评价。三部分重要的是后两部分----发现创新点2、之后分析文章,那一部分属于问题的提出、之后做这件事情解决的步骤、怎么论证做的这件事情是由价值的。2、(针对文章进行解析)3、对应之前提取的三部分,去解析正文。4、之后推广多篇论文。3、需要注意的1、同样的名词在不同的话中是不一样的。2、文章是要解决什么样的问题。3、提出一个问题、怎莫做、原创 2021-11-17 20:27:44 · 233 阅读 · 0 评论 -
python通过txt文本中提取目录(无论文章是否将目录提取到文章开头)
通过正则表达式来识别文章中的标题:以参考文献为截至import re# 分析headerdef main_read_txt(): url = "txt\\zhengwen.txt" with open(url, "r", encoding='utf-8') as f: count = f.readlines() for line in count: if line.find('参考文献(References)') < 0原创 2021-11-17 11:15:05 · 1385 阅读 · 0 评论 -
python通过库自带函数和自己编写的函数-实现的一个中文文本摘要程序(两种方法)
方法一:(自带函数操作)# 通过使用hanlp中的函数HanLP.extractSummary('正文', 10)方法二:(自定义函数操作)# coding:utf-8import nltkimport numpyimport jiebaimport codecsN = 100 # 单词数量CLUSTER_THRESHOLD = 5 # 单词间的距离TOP_SENTENCES = 5 # 返回的top n句子# 摘要提取几句话-分句def sent_tokenize原创 2021-11-15 20:38:24 · 1364 阅读 · 0 评论 -
python --LDA处理文章,分类提取数据
将文章分为十类: def loadCorpusFromFile(self, fn, stopwords): # 中文分词 f = open(fn, 'r', encoding='utf-8') text1 = f.readlines() text1 = "".join(text1) text1 = text1.split("。") text = "" for itext in text1:原创 2021-11-15 20:18:51 · 1470 阅读 · 0 评论 -
python解析pdf,读取文字,可识别两栏pdf等
python解析pdf,读取文字,可识别两栏pdf等一、解析我们的pdf文件,首先第一步是解析普通类别的pdf(只有一栏)代码中包含注释(不懂得可以留言)二、处理拥有两栏等类型的pdf为什么要单独分析两栏呢?代码中包含注释(不懂得可以留言)欢迎大家留言交流!!!!!!!!一、解析我们的pdf文件,首先第一步是解析普通类别的pdf(只有一栏)代码中包含注释(不懂得可以留言)使用的话,只需要修改自己的pdf路径即可# encoding: utf-8import sysimport importlib原创 2021-11-08 17:30:59 · 6887 阅读 · 24 评论 -
豆瓣图书短评爬取(其中一本书的短评<前十页>)
目标图书是“流浪地球”(只是一个图书编号不同)爬取前十页,包括评论人员的名称、评论日期、评论等级、被赞个数、评论内容。先看运行结果:(由于输出比较多直截首尾的图):直接上代码:有疑问或者需求可以在下方评论。(共同进步)import requestsfrom bs4 import BeautifulSoupimport timeheaders = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/53原创 2021-06-04 22:07:25 · 574 阅读 · 1 评论 -
Python人物头像动漫化
Python人物头像动漫化人物头像动漫化:源程序代码(注释已经尽可能详细):运行结果如下:access_token的数值:原照片:动漫化后的照片:人物头像动漫化(戴口罩):源程序代码如下(注释已经尽可能详细):运行结果如下:有问题请留言(点个赞呗!~~~)里面应用的是百度ai官网申请的数据。人物头像动漫化:源程序代码(注释已经尽可能详细):""" __author__="dazhi" 2021/3/20-22:18"""import requestsimport base64原创 2021-03-21 16:11:33 · 891 阅读 · 4 评论 -
Python实现人脸识别
Python实现人脸识别1、首先进行训练数据操作:使用的数据集样子:源程序代码如下(代码中有注释):运行结果如下:2、人脸识别操作(基于LBPH):源程序代码如下:运行结果如下:3、所用到的训练数据文件夹:1、首先进行训练数据操作:使用的数据集样子:源程序代码如下(代码中有注释):""" __author__="dazhi" 2021/3/20-20:41"""import osimport cv2import sysfrom PIL import Imageimport原创 2021-03-20 22:06:42 · 4613 阅读 · 5 评论 -
Python实现人脸检测(个人、多人、视频)
Python实现人脸检测(个人、多人、视频)1、加载图片:源程序代码如下:运行结果如下:2、图片灰度转换:源程序代码如下:运行结果如下:3、修改图片尺寸(在此次人脸检测案例中未用到):源程序代码如下:运行结果如下:4、绘制矩形-圆形(只是简单地在图片上随便画一个):源程序代码如下:运行结果如下:5、图像单个人脸检测:源程序代码如下:运行结果如下:6、图像多个人脸检测:源程序代码如下:运行结果如下:7、视频中的人脸检测:源程序代码如下:运行结果如下:我们先逐步进行学习。我将人脸检测的学习步骤分为如下几个方面原创 2021-03-20 18:41:19 · 6092 阅读 · 4 评论 -
Python实现头像换脸(AI换脸)
Python实现头像换脸(AI换脸)AI换脸源程序代码如下(注释已经尽可能详细):程序运行结果:需要的两个照片:对应代码里的1.png和2.png运行代码之后生成的3.png(合成效果图还不错~~~~~)相关变量输出结果(变量的输出位置以及相关描述已经写在代码注释中)response1:req_con:rectangle:imgdata:接口调用来源:AI换脸源程序代码如下(注释已经尽可能详细):""" __author__="dazhi" 2021/3/19-19:42"""# 首原创 2021-03-19 22:22:55 · 8270 阅读 · 10 评论