- 博客(27)
- 资源 (17)
- 收藏
- 关注
原创 Attention is all you need(Transformer详解)深度理解
通过浏览Transformer的整体框架图可会产生疑惑,对于编码器Encoder的输出部分是怎样传递给解码器Decoder的呢?Attention是用于计算相关程度的,例如在翻译过程中,不同的英文对中文的依赖程度不同。Attention is all you need中用到的核心公式是:这个公式中的Q、K和V分别代表Query、Key和Value。单看这个公式,其实并不能很好地理解Attention到底在做什么。我们来一步一步进行分析。首先QKV如何计算的,他是用过将输入矩阵进行三次线性变化生成的。
2023-07-05 10:37:51 326
原创 Attention is all you need的思维导图(详细)
(transformer) Attention is all you need
2022-06-21 15:18:05 356 1
原创 Attention Is All You Need-李沐老师
李沐老师讲解attention is all you need(transformer)
2022-06-09 11:39:41 443
原创 python-LAC使用方法的相关总结
代码如下:from LAC import LAC# 分词的功能def fenci(): # 装载分词模型 lac = LAC(mode='seg') # 单个样本输入,输入为Unicode编码的字符串 text = u"LAC是个优秀的分词工具" seg_result = lac.run(text) print(seg_result) # 批量样本输入, 输入为多个句子组成的list,平均速率会更快 texts = [u"LAC是个
2021-12-01 09:38:36 2715
原创 python直接获取pdf图片的时候,报错:doc._getXrefLength和doc.getObjectString(i)
将其进行修改:fitz 库 安装的不是pip install fitz 而是 pip install pymupdf报错AttributeError: ‘Document’ object has no attribute ‘_getXrefLength’ REF = doc._getXrefLength()改成 REF = doc.xref_length()定义对象字符串 taxt = doc.getObjectString(i)改成 text = doc.xref_
2021-11-30 16:18:10 5353 1
原创 python提取pdf中的所有图表
1、将我们的pdf转换成图片: def main(self, pic_path, cropped_pic_path, pgn=None): """ 主函数 :param pic_path: 被截取的图片路径 :param cropped_pic_path: 图片的截图的保存路径 :param pgn: 指定获取截图的对象的索引 :return: """ if pgn is
2021-11-29 15:33:13 1310
原创 python提取pdf中的图片-版本一
具体代码如下:import fitzdef func(doc): for i in range(len(doc)): imglist = doc.getPageImageList(i) for j, img in enumerate(imglist): xref = img[0] pix = fitz.Pixmap(doc, xref) # make pixmap from image
2021-11-28 11:52:43 539
原创 蓝桥杯BASIC-10。十进制转十六进制(python)
代码如下:(如有不懂可以私聊)if __name__ == '__main__': num = input() str1 = str(hex(int(num,10))[2:]) print(str1.upper())
2021-11-27 20:08:16 298
原创 蓝桥杯BASIC-11。十六进制转十进制(python)
如下:(如有不懂可以私聊)if __name__ == '__main__': num = input() print(int(num,16))
2021-11-27 20:07:13 355
原创 蓝桥杯BASIC-12。十六进制转八进制(python)
代码如下:(如有不懂可以私聊)if __name__ == '__main__': n = int(input()) for i in range(n): a = input() print(oct(int(a, 16))[2:])"""进制转换函数:2-8、10、16oct(int(n,2))、int(n,2)、hex(int(n,2 ))依次类似"""...
2021-11-27 20:05:59 231
原创 蓝桥杯BASIC-13。数列排序(python)
代码如下:(如有不懂可以私聊)def paixu(num,num2): array = input().split(" ") array = list(map(int, array[0:-1])) array.sort(reverse=False) for i in range(num): print(array[i],end="") print(" ",end="")if __name__ == '__main__': num
2021-11-27 20:04:46 236
原创 蓝桥杯BASIC-01。A+B问题(python)
代码如下:(如有不懂可以私聊)def function1(num1,num2): print(int(num1)+int(num2))if __name__ == '__main__': num = input() num1,num2 = num.split(" ") function1(num1,num2)
2021-11-27 20:03:16 95
原创 王老师经验分享
1、应该找的东西:寻找一级期刊的文章:软件学报、计算机学报2、解析的内容:1、(1-2针对摘要进行解析)1、问题的背景、做什么(完成了什么)、对作品的评价。三部分重要的是后两部分----发现创新点2、之后分析文章,那一部分属于问题的提出、之后做这件事情解决的步骤、怎么论证做的这件事情是由价值的。2、(针对文章进行解析)3、对应之前提取的三部分,去解析正文。4、之后推广多篇论文。3、需要注意的1、同样的名词在不同的话中是不一样的。2、文章是要解决什么样的问题。3、提出一个问题、怎莫做、
2021-11-17 20:27:44 253
原创 python通过txt文本中提取目录(无论文章是否将目录提取到文章开头)
通过正则表达式来识别文章中的标题:以参考文献为截至import re# 分析headerdef main_read_txt(): url = "txt\\zhengwen.txt" with open(url, "r", encoding='utf-8') as f: count = f.readlines() for line in count: if line.find('参考文献(References)') < 0
2021-11-17 11:15:05 1456
原创 python通过库自带函数和自己编写的函数-实现的一个中文文本摘要程序(两种方法)
方法一:(自带函数操作)# 通过使用hanlp中的函数HanLP.extractSummary('正文', 10)方法二:(自定义函数操作)# coding:utf-8import nltkimport numpyimport jiebaimport codecsN = 100 # 单词数量CLUSTER_THRESHOLD = 5 # 单词间的距离TOP_SENTENCES = 5 # 返回的top n句子# 摘要提取几句话-分句def sent_tokenize
2021-11-15 20:38:24 1391
原创 python --LDA处理文章,分类提取数据
将文章分为十类: def loadCorpusFromFile(self, fn, stopwords): # 中文分词 f = open(fn, 'r', encoding='utf-8') text1 = f.readlines() text1 = "".join(text1) text1 = text1.split("。") text = "" for itext in text1:
2021-11-15 20:18:51 1499
原创 python解析pdf,读取文字,可识别两栏pdf等
python解析pdf,读取文字,可识别两栏pdf等一、解析我们的pdf文件,首先第一步是解析普通类别的pdf(只有一栏)代码中包含注释(不懂得可以留言)二、处理拥有两栏等类型的pdf为什么要单独分析两栏呢?代码中包含注释(不懂得可以留言)欢迎大家留言交流!!!!!!!!一、解析我们的pdf文件,首先第一步是解析普通类别的pdf(只有一栏)代码中包含注释(不懂得可以留言)使用的话,只需要修改自己的pdf路径即可# encoding: utf-8import sysimport importlib
2021-11-08 17:30:59 7701 25
原创 豆瓣图书短评爬取(其中一本书的短评<前十页>)
目标图书是“流浪地球”(只是一个图书编号不同)爬取前十页,包括评论人员的名称、评论日期、评论等级、被赞个数、评论内容。先看运行结果:(由于输出比较多直截首尾的图):直接上代码:有疑问或者需求可以在下方评论。(共同进步)import requestsfrom bs4 import BeautifulSoupimport timeheaders = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/53
2021-06-04 22:07:25 605 1
原创 Android 自定义界面的弹出框(可输入数据)
效果图:参考的网址:https://blog.csdn.net/zuiwuyuan/article/details/48194807作品资源网址:https://download.csdn.net/download/Thefreelittle/19355173
2021-06-02 21:49:13 252 2
原创 Python人物头像动漫化
Python人物头像动漫化人物头像动漫化:源程序代码(注释已经尽可能详细):运行结果如下:access_token的数值:原照片:动漫化后的照片:人物头像动漫化(戴口罩):源程序代码如下(注释已经尽可能详细):运行结果如下:有问题请留言(点个赞呗!~~~)里面应用的是百度ai官网申请的数据。人物头像动漫化:源程序代码(注释已经尽可能详细):""" __author__="dazhi" 2021/3/20-22:18"""import requestsimport base64
2021-03-21 16:11:33 938 4
原创 Python实现人脸识别
Python实现人脸识别1、首先进行训练数据操作:使用的数据集样子:源程序代码如下(代码中有注释):运行结果如下:2、人脸识别操作(基于LBPH):源程序代码如下:运行结果如下:3、所用到的训练数据文件夹:1、首先进行训练数据操作:使用的数据集样子:源程序代码如下(代码中有注释):""" __author__="dazhi" 2021/3/20-20:41"""import osimport cv2import sysfrom PIL import Imageimport
2021-03-20 22:06:42 4765 5
原创 Python实现人脸检测(个人、多人、视频)
Python实现人脸检测(个人、多人、视频)1、加载图片:源程序代码如下:运行结果如下:2、图片灰度转换:源程序代码如下:运行结果如下:3、修改图片尺寸(在此次人脸检测案例中未用到):源程序代码如下:运行结果如下:4、绘制矩形-圆形(只是简单地在图片上随便画一个):源程序代码如下:运行结果如下:5、图像单个人脸检测:源程序代码如下:运行结果如下:6、图像多个人脸检测:源程序代码如下:运行结果如下:7、视频中的人脸检测:源程序代码如下:运行结果如下:我们先逐步进行学习。我将人脸检测的学习步骤分为如下几个方面
2021-03-20 18:41:19 6575 4
原创 深度学习代码案例-Mnist手写数字识别(全连接)
深度学习代码案例-Mnist手写数字识别(全连接)1、数据集介绍2、特征值参考图片3、目标值(one-hot编码)参考图片4、源程序代码如下(注释已经尽可能详细了):5、程序输出结果如下6、模型完善增加准确率计算。6-1、准确率计算:6-2、修改后的源程序代码如下:(在上面的程序基础上进行的添加)6-3、程序运行结果如下(增加准确率)7、用到的文件夹如下:1、数据集介绍2、特征值参考图片3、目标值(one-hot编码)参考图片4、源程序代码如下(注释已经尽可能详细了):""" __au
2021-03-19 18:38:58 1106
原创 深度学习代码案例-狗图片读取
深度学习代码案例-狗图片读取源程序代码如下:各个变量输出结果如下:(输出位置在代码中已经注释了)filenamefile_listkeyvaluekey_newvalue_newimageimage_new最后读入图片并转为张量的结果是:用到的dog文件夹:源程序代码如下:""" __author__="dazhi" 2021/3/18-14:10"""#对于图片元素有三个维度:图片长度、图片宽度、图片通道数(rgb是3黑白是1)import osimport tensorflow
2021-03-18 18:47:35 379 3
主要包含了四个提用词文件,可以供大家选择 停用词文件中文停用词表cn-stopwords.txt哈工大停用词表hit
2023-07-26
该文件为 3DMM-Deep3dPortrait 中 BFM 的模型文件,压缩包内为 MorphableModel.mat 原始
2023-03-15
大学英语六级的高频词汇,大约是不到一千个词,有音标翻译等等
2023-03-01
大学英语六级词汇汇总,是乱序排列的,总共大约160页pdf,带音标等等
2023-03-01
《随机过程及其在金融的应用》习题答案+公式原理准则汇总 习题答案包括完整的第二章、第三章、第四章、第五章 以及公式准则概念汇总等
2023-03-01
MySQL中文拼音数据库(6565字,全拼+首字母(大小写均有))
2022-08-12
基于python,提取pdf中涉及到的相关表格
2022-06-27
(qtp安装报错时需要的)Microsoft Script Debugger.rar
2021-06-11
curses-2.2.1+utf8-cp37-cp37m-win_amd64.whl
2021-05-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人