python+excel
文章平均质量分 76
铁盒薄荷糖
这个作者很懒,什么都没留下…
展开
-
Pandas数据处理(取数/删除NaN)
subset:列表----columns或者index,只删除指定列/行。df.iloc[ 行序 ] [列序 ]列转换为一维数组,然后访问该数组索引处的值。df.iloc[ 行 ] [ '列名' ]#取出某一列,然后根据行序列进行对第n行取值。是标量的快速访问方法,可从 Pandas。#访问行,然后使用列名访问值。df.iloc[ 行序, 列序 ]thresh:阈值,类型为int,1或者columns则是删除列。删除至少有一个NaN的行/列;删除全部都是NaN的行/列。,并且使用起来最简单。原创 2024-03-29 16:56:09 · 473 阅读 · 0 评论 -
Python抓取网页中的超链接以及其文本
0.准备工作:读入网页加以解析抓取,需要用到的软件包是 requests_html。我们此处并不需要这个软件包的全部功能,只读入其中的 HTMLSession 就可以。我们不想要集合,只想要其中的链接字符串。所以我们先把它转换成列表,然后从中提取第一项,即网址链接。#以把抓取的内容输出到Excel中了。Pandas内置的命令,就可以把数据框变成csv格式。),它就把找到的所有描述文本和链接路径都返回给我们。确认该区域就是我们要找的链接和文字描述后,选择。中查看的时候,有可能是乱码。结果数据对应的文本。原创 2022-11-22 11:31:57 · 3791 阅读 · 1 评论 -
利用Python中的openpyxl/Pandas库操作excel
xlrd库:从excel中读取数据,支持xls、xlsxxlwt库:对excel进行修改操作,不支持对xlsx格式的修改xlutils库:在xlw和xlrd中,对一个已存在的文件进行修改。openpyxl:主要针对xlsx格式的excel进行读取和编辑。原创 2023-01-03 14:06:20 · 10732 阅读 · 1 评论 -
Pandas中对DataFrame列名进行重命名
Pandas是一个用于数据分析和操作的Python库。在pandas中几乎所有的操作都围绕着DataFrame。Dataframe是一个二维表的抽象表示,可以包含各种数据。原创 2022-11-25 13:28:39 · 17683 阅读 · 0 评论 -
Python利用pandas库一次读取多个excel文件并合并
他们具有相同的列名,想要将他们纵向合并起来,用append函数。(若想横向合并,只要用concat函数替换这里的就行了,但是注意要用相同的行名/行索引。这里要用到os库的walk和path功能。现在有一个文件夹,里面有三个excel,将一个文件夹里的多个文件读取,并合并。否则就会有隐藏的缓存文件。原创 2022-11-24 18:01:04 · 7807 阅读 · 1 评论 -
Pandas数据合并与拼接的5种方法
Pandas数据合并与拼接的5种方法。必须存在于左右两个DataFrame中,如果没有指定且其他参数也没有指定,则以两个DataFrame列名交集作为连接键;suffixes:字符串值组成的元组,用于指定当左右DataFrame存在相同列名时在列名后面附加的后缀名称,默认为('_x', '_y');left_on:左侧DataFrame中用于连接键的列名,这个参数左右列名不同但代表的含义相同时非常的有用;没有指定连接键,默认用重叠列名,没有指定连接方式,默认inner内连接(取key的交集)转载 2022-11-24 17:14:49 · 28096 阅读 · 2 评论 -
【Python处理EXCEL】--pandas导入Excel文件
本文使用的是Python集成运行环境。原创 2022-11-16 15:48:54 · 13270 阅读 · 0 评论