Python
文章平均质量分 53
记录Python相关的内容
bjwhile
这个作者很懒,什么都没留下…
展开
-
Python将PDF按页转换为图片
有时我们需要将PDF转换为图片做一些处理,一部分PDF阅读器例如Acrobat具备类似的功能,但是软件不同版本的功能有一定的差异,使用Python处理各类文件更加方便。本次分享了使用Python将PDF转换为图片的方法,通过multiprocess等工具库可以批量处理PDF文件,进一步提高效率。...原创 2022-08-01 20:19:33 · 3957 阅读 · 0 评论 -
Python根据内部文件名批量更改文件夹名称
文件批量处理是在管理大量文件时经常会用到的功能,今天采用Python实现一个简单的批量处理应用。原创 2022-06-12 16:19:33 · 950 阅读 · 0 评论 -
Python安装失败0x80070642错误解决方法
在安装Python时出现0x80070642错误码可以在安装时将install for all users选项取消勾选后面按照流程继续即可完成安装原创 2021-09-30 00:14:11 · 1803 阅读 · 0 评论 -
下载安装python函数库
下载安装python函数库文章目录下载安装python函数库前言一、函数库下载二、函数库安装总结前言由于最近电脑坏了所以python需要重新下载安装需要的函数库,通过命令行pip install直接下载函数库因为网络问题经常出现失败的情况,所以查找了有没有比较好的下载函数库的资源和方法,下面以numpy库为例进行下载安装步骤的介绍一、函数库下载首先是我找到的可以下载函数库安装包的网站,上面有常用的python库whl文件资源https://www.lfd.uci.edu/~gohlke原创 2021-09-21 11:41:52 · 3833 阅读 · 2 评论 -
关于NLP模型GPT-2的学习笔记(三)
关于NLP模型GPT-2的学习笔记(三)文章目录关于NLP模型GPT-2的学习笔记(三)前言一、准备工作二、文本生成三、模型训练总结前言前面主要介绍了GPT-2的基本原理和工作流程,本次会进行一些训练模型和模型使用的实践一、准备工作首先从github下载GPT-2的程序和部分已经训练好的模型GPT-2模型在下载好之后,将程序解压到制定位置,注意路径尽量不要包含中文二、文本生成我们先打开命令行设置路径到对应位置在生成文本时,使用generate.py文件,其中有一些参数可以配置,在原创 2021-03-20 23:46:52 · 219 阅读 · 0 评论 -
关于NLP模型GPT-2的学习笔记(二)
关于NLP模型GPT-2的学习笔记(二)文章目录关于NLP模型GPT-2的学习笔记(二)前言一、GPT-2基本机制二、GPT-2数学模型总结前言上一次我们介绍了GPT模型的基本结构,下面对于GPT的基本工作流程进行介绍:一、GPT-2基本机制GPT-2 可以处理最长 1024 个单词的序列。每个单词都会和它的前续路径一起经过所有的解码器模块。运行一个训练好的 GPT-2 模型,最简单的方法就是让它自己随机工作(生成无条件样本)。我们也可以给它一些限制条件,让它生成一些关于特定主题的文本(即原创 2021-03-20 00:50:18 · 347 阅读 · 0 评论 -
关于NLP模型GPT-2的学习笔记(一)
关于NLP模型GPT-2的学习笔记(一)文章目录前言一、GPT模型是什么?二、NLP模型简介三、GPT模型架构3.1编码器模块3.2译码器模块总结前言近期GPT-3的热度在NLP领域很高,因此对于这个模型有了尝试的想法,目前GPT-3的模型和资源还不太多,因此先用GPT-2尝试一下训练模型和文本生成。一、GPT模型是什么?在实践之前,对于GPT模型的基本原理做了一定的了解,下面进行一些简单的介绍。GPT模型是OPEN-AI构建的自然语言处理模型,其在文本生成上往往能产生超出预料的效果,与B原创 2021-03-20 00:39:28 · 334 阅读 · 1 评论 -
python 使用PIL工具包中的pytesseract函数识别英文字符
文章目录一、PIL是什么?二、使用步骤1.代码实现2.识别结果总结一、PIL是什么?python的PIL工具包是图像处理相关的工具包,其中包含很多非常方便的函数,pytesseract是对于文字识别的基础函数,对于文字的字体有一定的要求,对于非标准字体的识别正确率较低二、使用步骤1.代码实现首先我们需要下载PIL和pytesseract两个库,在命令行窗口python/Script路径下使用pip install指令下载即可pip install PILpip install pytess原创 2021-03-31 12:58:07 · 1102 阅读 · 0 评论 -
中文词云功能实现
中文词云文章目录中文词云前言一、词云是什么?二、词云的实现总结前言词云是一个统计并展示文本关键内容的方式,因为这种表现手法令人印象深刻,对于这种展示方式有了一定的兴趣并进行了学习。一、词云是什么?“词云”就是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高的“关键词”的视觉上的突出。词云图过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。二、词云的实现这里我尝试了对于中文文本的词云功能的实现,主要使用了wordcloud和jieba两个库,由于w原创 2021-04-01 22:00:16 · 1965 阅读 · 0 评论 -
利用python将txt文件转换为csv
利用python将txt文件转换为csv文章目录利用python将txt文件转换为csv前言实现过程总结前言目前深度学习相关的函数库对于大数据的处理基本都是以CSV文件为基础进行的,那么在进行深度学习的处理之前,需要先统一数据文件的格式。实现过程在此,我们利用python中的numpy和pandas两个函数库对于txt文件进行格式修改。首先,我们需要安装所需的函数库,在命令行中找到/python/Script路径用以下指令进行下载。pip install pandaspip inst原创 2021-04-05 19:28:01 · 16305 阅读 · 3 评论 -
python读取csv文件并添加索引
python读取csv文件并添加索引文章目录python读取csv文件并添加索引前言实现过程总结前言对于csv文件进行处理一个重要的步骤是为数据添加索引,方便后续的数据操作实现过程这里我们使用pandas库中的read_csv()函数,在读取csv数据的同时可以对其添加行索引和列索引。import pandas as pdobj=pd.read_csv('testdata.csv')print(obj)read_csv()不对属性进行设置的缺省状态下,对于csv文件进行读取操作原创 2021-04-05 20:02:08 · 9968 阅读 · 1 评论 -
python用matplotlib显示数据
python用matplotlib显示数据文章目录python用matplotlib显示数据前言一、Python的数据显示二、实现步骤总结前言 数据可视化是数据处理过程中的一个重要流程,有助于对数据整体的特征有一个直观的了解,本次对于用python对数据的显示进行了一些尝试一、Python的数据显示目前Python最方便的数据显示库是matplotlib,里面包含了很多用于绘制统计曲线等展现方式的功能。下面是将一个简单的二维数据通过折线图的形式显示的样例二、实现步骤首先需要下载mat原创 2021-04-06 10:34:49 · 3425 阅读 · 0 评论 -
python列表list的基本性质
python列表list的基本性质文章目录python列表list的基本性质前言Python列表总结前言列表list是python中基本的数据结构,列表中的每个元素都分配一个数字作为索引进行管理,在形式上列表与c语言的数组有一定的相似之处,但是列表的灵活性与易用性是远远超过数组的。Python列表Python的列表类型为list,list的索引从0开始,其中的元素不需要具有相同的类型,因此可以把各种类型的数据存在一个列表中,列表的声明也很简单,使用逗号将数据区分放在中括号中就可以完成创建原创 2021-04-06 10:55:23 · 426 阅读 · 0 评论 -
python对文件内容的去重
python对文件内容的去重文章目录python对文件内容的去重前言实现步骤总结前言很多时候我们获取的数据存在大量重复,重复数据在进一步处理时会降低处理效率,且可能导致错误,因此内容去重是数据处理一个重要步骤。实现步骤通过list的set()和sort()函数对于数据进行顺序去重,读取文件夹中的所有文件,生成文件列表,读取文件内容列表,进行去重和按原索引顺序排序。首先我们需要将所有需要去重的文件列举出来,通过os库的walk()函数可以获取路径下的所有文件和路径名import osd原创 2021-04-06 11:00:08 · 2681 阅读 · 0 评论