自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 python提取pdf表格数据并保存到excel中

pdfplumber操作pdf文件python开源库pdfplumber,可以较为方便地获取pdf的各种信息,包含pdf的基本信息(作者、创建时间、修改时间…)及表格、文本、图片等信息,基本可以满足较为简单的格式转换功能。一、pdfplumber安装及导入跟其他包一样,支持使用pip安装,安装命令:pip install pdfplumber安装成功后,可直接用import导入,导入命令:import pdfplumber二、pdfplumber基础使用1、基础知识(1)pdfplu

2022-04-16 08:56:17 6748 8

原创 环境变量 | 是不是必须配置?怎么配置?

内附 mysql 、 python 环境变量配置方法。

2024-05-31 20:15:00 968

原创 网址URL复制粘贴后,中文部分变“乱码“?

url复制粘贴后中文变“乱码”,出现原因及解决办法

2024-05-20 20:15:00 715

原创 python | 简易版: pdf 转换为 word 方法

简易版python将pdf转换为word方法——主打一个免费简单实用。

2023-11-29 17:10:04 1003 1

原创 python—openpyxl操作excel详解

openpyxl属于第三方模块,在python中用来处理excel文件。可以对excel进行的操作有:读写、修改、调整样式及插入图片等。但只能用来处理【 .xlsx】 后缀的excel文件。

2023-10-24 21:00:31 8120 1

原创 python-字符串去掉空格的常见方法

去掉字符串的全部空格、字符串连续空格保留一个等,都需要结合其他的方法来实现。以下简单归纳了去除字符串空格的3种应用场景及相应处理方法,可供参考。

2023-09-18 21:16:00 3957

原创 python-保留小数位数的3种方法

在python实际运用中,需要对小数位数进行截取保留。以下是,python保留小数点位数的3种方法。

2023-09-17 16:00:43 5047

原创 python | 将pdf文件转换为图片,这一招就够了

pdfplumber 将 pdf 转换为图片的使用方法很简单,代码也不复杂。可能较为麻烦的就是,对本地环境有一定的要求,需要安装和配置。

2023-08-28 09:23:23 5129

原创 python——json、字典的区别及相互转换方法

python中,json与字典(dict)之间的区别,及相互转换。

2023-08-19 17:56:01 4417 2

原创 python中——requests爬虫【中文乱码】的3种解决方法

python中requests爬虫【中文乱码】问题,是最常遇到的问题,对于初学者来说,是很困恼的。本文将详细说明,python中使用requests库编写爬虫程序时,出现【中文乱码】的原因,及常见3种解决办法。

2023-07-24 13:23:14 13729 3

原创 python | 巧用字典get方法实现词频统计、关系映射

python字典内置很多函数和方法,其中get()方法是最基础、常见的查询方法,可灵活运用于多个场景。

2022-08-11 21:01:41 2628

原创 python- 工作/休息/调休日怎么精准判断

python的第三方模块chinesecalendar,提供了判断工作日、休息日、节假日的方法。不仅可以判断法定节假日,还可以返回节假日的名称,对调休日也可以做出判断,十分好用。如,打印出2022年5月1日-2022年5月31,是工作日的日期;打印出2022年5月1日-2022年5月31,是休息日的日期。...

2022-08-02 21:57:30 5519

原创 python-非标准格式json文件读取报错解决办法

报错如下:json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 2 column 1 (char 2)

2022-06-05 16:58:25 3770

原创 pandas—删除某行或某列数据

首先,创建一个DataFrame格式数据作为举例数据。# 创建一个DataFrame格式数据data = {'a': ['a0', 'a1', 'a2'], 'b': ['b0', 'b1', 'b2'], 'c': [i for i in range(3)], 'd': 4}df = pd.DataFrame(data)print('举例数据情况:\n', df)注:DataFrame是最常用的pandas对象,使用pandas读取数据文件后,

2022-05-15 17:42:54 45646 2

原创 pandas—添加新列的常见方法

pandas为DataFrame格式数据添加新列的方法非常简单,只需要新建一个列索引,再为其赋值即可。以下总结了5种常见添加新列的方法。首先,创建一个DataFrame结构数据,作为数据举例。import pandas as pd# 创建一个DataFrame结构数据data = {'a': ['a0', 'a1', 'a2'], 'b': ['b0', 'b1', 'b2']}df = pd.DataFrame(data)print('举例数据情况:\n', df)添加

2022-05-04 21:38:00 89015 4

原创 pandas—数据选择的常见用法

使用pandas时,经常会对某行、某列、满足条件的数据进行统计计算。以下总结了pandas数据选择的常见方法,包括loc、iloc等方法的使用。首先读取数据:df = pd.read_excel('zpxx.xlsx')1、元素、索引、列名获取可以利用DataFrame的基础属性values、index、columns,分别获取元素、索引、列名print('获取元素:\n', df.values) # 返回二维列表print('获取索引:\n', df.index) # 返回行的索引

2022-04-24 20:56:10 3245

原创 python字典排序方法

字典是“键-值对”的无序可变序列在实际运用中,对字典进行排序是一个比较常见的操作,主要用到了python内置函数sorted(),该函数可以对所有可迭代的对象进行排序操作。语法(python3):sorted(iterable, key=None,reverse=False)参数说明:iterable:可迭代对象,即可以用for循环进行迭代的对象;key:主要是用来进行比较的元素,只有一个参数,具体的函数参数取自于可迭代对象中,用来指定可迭代对象中的一个元素来进行排序;reverse:排序规

2022-01-16 17:42:46 83265 13

原创 python汉字简繁体转换方法

python的zhconv库提供了基于MediaWiki词汇表的最大正向匹配简繁体转换,pyhton2和python3都支持,可以满足简单的转换需求。以下总结了zhconv从安装到使用的方法(python3)。一、zhconv安装zhconv库直接使用pip就可以安装,安装命令:pip install zhconv二、zhconv使用方法zhconv支持以下地区词的转换:zh-cn 大陆简体zh-sg 马新简体(马来西亚和新加坡使用的简体汉字)zh-tw 台灣正體(台湾正体)zh-h

2022-01-13 09:15:34 7727 1

原创 python纯数字列表转换成字符串问题

Python中的join()函数用来将一个序列中所有元素,按指定的分隔符组合成新的字符串。常用来将列表、元组、字典类型数据转换成字符串使用语法:’sep’.join(seq)参数说明:sep:指定分隔符,可以为空。seq:需要连接的元素序列,可以是列表、元组、字典。返回值:按指定分隔符组合成的新字符串将列表转换成字符串(python3)实例1:列表元素全是字符串数据类型# 将元素全为字符串数据类型的列表转换成字符串a = ['1', '2', '3', 'abc', 'def']pri

2022-01-09 22:10:50 2281

原创 使用pip安装python库时报错

错误提示:Suggestion [3,General]: 找不到命令 pip,但它确实存在于当前位置。默认情况下,Windows PowerShell 不会从当前位置加载命令。如果信任此命令,请改为键入“.\pip”。有关详细信息,请参阅 “get-help about_Command_Precedence”。解决办法1:将原来命令:pip install lxml改为:.\pip install lxml解决办法2:配置环境变量出现上面错误,可以通过给python配置环境变量来解决。win

2022-01-08 18:02:29 4881

原创 python创建字典的常见方法

python字典以“键-值对”形式存在,所有的元素放在一对大括号“{}”中;字典中的“键”是不允许重复,“值”是可以重复的。以下总结了3种字典的构建方法一、直接赋值法使用=将一个字典赋值给一个变量,即可以创建一个字典变量。# # 直接赋值a = {}b = {'a': 1, 2: 'a', 1: 2, "b": 1, '''c''': 1}print('空字典:', a, type(a))print('字典b:', b, type(b))空字典:{} <class ‘dict’&

2022-01-04 07:15:00 16160 2

原创 python列表反转的4种方法

在某些应用中可能需要将列表元素进行逆序排列,也就是所有的元素位置反转。以下总结了python列表常见的4种反转方法:一、列表对象的reverse()方法语法:列表名.reverse()该方法没有返回值,将列表中的所有元素进行原地逆序# reverse()方法a = [1, 2, 3, 4, 5, 6, 7, 'abc', 'def']a.reverse()print('列表反转结果:', a)列表反转结果:[‘def’, ‘abc’, 7, 6, 5, 4, 3, 2, 1]二、内置r

2022-01-01 09:03:50 53210 2

原创 python一句代码生成26个英文字母

python生成26个大小写英文字母实现代码:# 生成26个英文字母char_dx = [chr(i) for i in range(65, 91)]char_xx = [chr(i) for i in range(97, 123)]print('26个大写字母:', char_dx)print('26个小写字母:', char_xx)结果:原理:上面实现方法,主要用到了python的内置函数:chr() 函数chr()和ord()函数,是配对使用的,详细用法如下:1、chr()函

2021-12-30 15:54:40 11334

原创 python内置csv模块读写csv文件

CSV文件,是一种常用的文本格式,因为其格式简单、兼容性好,被广泛使用,特别是用于程序之间转换数据。python也内置了csv模块,用来读写csv文件。一、csv模块写入数据语法:writer(csvfile, dialect=‘excel’,**fmtparams)csvfile:文件对象dialect:编码风格,默认为是excel,也就是用逗号(,)分隔,一般不去更改它。**fmtparams:dialect格式参数,有delimter(分隔符,默认为逗号)实例1:最简单的不加任何参数,直

2021-12-29 08:45:00 928

原创 python占位符%s%d%f

%占位符是python程序中,经常会用到的一种占位方式。其作用是替后面的变量值占一个位置例如,格式化输出九九乘法表,就用到了%占位符# 九九乘法表print('九九乘法表')for i in range(1, 11): for j in range(1, i + 1): print('%dx%d=%d\t' % (j, i, j * i), end="") print("")结果:上面用到了%d整数(int)占位符python程序中常用的%占位符1、%s,

2021-12-28 09:21:53 42400 2

原创 python正则如何匹配中文汉字

正则表达式匹配中文汉字,在实际应用中十分常见。比如:爬虫网页文本提取、验证用户输入标准等。以下面文本字符串为例,匹配出astr这个字符串中的所有汉字。import reastr = '''aaaaa何时when 杖尔看see南雪snow,我me与梅花plum blossom两白头'''下面介绍两种方法(本文环境为python3)一、使用Unicode编码来匹配中文常见的中文Unicode编码范围:\u4e00-\u9fa5实现匹配代码:re.findall(’[\u4e00-\u9fa5]

2021-12-27 07:54:51 34718

原创 python列表常见的5种去重方法

列表去重在python面试和实际运用中,十分常见,也是最基础的重点知识。以下总结了5种常见的列表去重方法一、使用for循环实现列表去重此方法去重后,原顺序保持不变。# for循环实现列表去重list1 = ['a', 'b', 1, 3, 9, 9, 'a']list2 = []for l1 in list1: if l1 not in list2: list2.append(l1)print(list2)结果:[‘a’, ‘b’, 1, 3, 9]二、使用列表

2021-12-26 15:29:40 27213 5

世界各个国家或地区国际域名缩写

文件内容:世界各个国家中英文名、国际域名缩写(简称或英文缩写)和电话代码。 如:安道尔共和国,Andorra,AD,376 文件保存格式:包括excel、json两种数据格式。

2024-04-28

MongoDB数据库安装教程

MongoDB数据库安装教程图文详解,内附MongoDB官方安装包。

2023-10-16

mysql环境安装详细教程-最简单的MySQL安装方法

MySQL安装可分为2种:一是msi安装包安装,直接点击,按照提示步骤即可安装;一种就是压缩包解压安装,直接从mysql官网下载zip文件,解压即可使用,但是需要一定的配置。本教程针对第二种解压安装进行了说明,并附带安装压缩文件。

2023-09-10

ImageMagick安装及报错解决办法

该资源中包括:(1)ImageMagick-7.1.1-15-Q16-HDRI-x64-dll.exe安装包、简易安装方法;(2)使用ImageMagick时常见报错:FailedToExecuteCommand “gswin64c.exe”,解决办法及配置文件octave-8.2.0-w64.zip。 ImageMagick常见使用场景:python 的开源库 pdfplumber,将 pdf 文件转换为图片时,需要在本地安装和配置软件ImageMagick。

2023-08-27

python提取pdf中表格数据并保存到excel中

下载后该文件后,在python环境中,直接运行pdf_test.py脚本,输入需要提取的pdf文件详细路径,即可将pdf中的表格数据转换为excel文件,并保存到本地。

2023-08-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除