pandas的增删查改

最新推荐文章于 2024-07-26 17:36:26 发布

Python爬虫与数据分析

最新推荐文章于 2024-07-26 17:36:26 发布

阅读量891

点赞数 2

文章标签： pandas python 数据分析数据挖掘开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44623587/article/details/126070839

版权

pandas是为了解决数据分析任务而生的。pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法，能很好的帮助我们分析爬取到的数据。

环境准备

pandas、numpy

本篇所有代码都运行在jupyter上

目录

1、增加数据

2、删除数据

3、查询数据

4、修改数据

准备工作

先生成两个数据集

data = {'city': ['北京', '上海', '广州', '深圳'],
         '2018': [33105, 36011, 22859, 24221]}
data = pd.DataFrame(data)

data2 = {'city': ['北京', '上海', '广州', '深圳'],
         '2017': [28014, 30632, 21503, 22490]}
data2 = pd.DataFrame(data2)

1、增加数据

合并数据

方法一：用concat合并

pandas.concat(objs,axis = 0,ignore_index = False,keys = None)

objs:Series，DataFrame或Panel对象的序列或映射。

axis：串联的轴，默认为0，即以索引串联（竖直拼接）；如果为1，则以列串联（水平拼接）

ignore_index：清除现有索引并将其重置，默认为False。

key：在数据的最外层添加层次结构索引。

data_new = pd.concat([data, data2], axis=1)

运行结果：

方法二：用merge合并

DataFrame.merge(self，right，how =‘inner’，on = None)

right：指要合并的对象

on：指要加入的列或索引级别名称，必须在两个DataFrame中都可以找到。

how：决定要执行的合并类型：left（使用左框架中的键）、right、inner（交集，默认）、outer（并集）

data.merge(data2,on='city',how='left')

运行结果：

方法三：用join合并

这种方法需要指定相同列索引的后缀

1、

data.join(data2,lsuffix='_data', rsuffix='_data2')

运行结果：

2、

data.set_index('city').join(data2.set_index('city'))

运行结果：

方法四：用append合并

data.append(data2)

运行结果：

增加列

city = ['南京', '杭州', '合肥', '青岛']
data.insert(0,'city2', city)

在第0列，加上column名称为city2，值为city的数据。

运行结果：

2、删除数据

删除包含某值的行

data1 = data2[data2.city != '深圳']

去掉city为深圳的行

运行结果：

删除行

data2.drop([0, 1], axis=0)

运行结果：

删除列

data2.drop(['city'], axis=1)

运行结果：

删除重复行

data['city'].drop_duplicates()

默认删除后面出现的重复值，即保留第一次出现的重复值

3、查询数据

1、data['column_name'] 和data[row_start_index, row_end_index]
2、data.loc[index,column]
3、iloc[row_index, column_index]

查看单列

data['city']

运行结果：

查看多列

data[['city', '2018']]

运行结果：

查看行

data.loc[2]

运行结果：

data.loc[1:1]

运行结果：

查看多行

data.loc[1:]

运行结果：

data.iloc[1:,:1]

运行结果

data.iloc[[1,3],:2]

运行结果：

4、修改数据

修改某个数据

data.iloc[1,1] = 100

运行结果：

data.loc[2,'city'] = '广州(粤语)'

运行结果：

修改某列数据

data.iloc[:,1] = [1, 10, 100, 1000]

运行结果：

修改某行数据

data.iloc[3,:] = ['深圳(普通话)', 1100]

运行结果：

如果对你有帮助的话给我点赞呗

Python爬虫与数据分析

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
pandas的增删查改

pandas是为了解决数据分析任务而生的。pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法，能很好的帮助我们分析爬取到的数据。环境准备pandas、numpy本篇所有代码都运行在jupyter上目录1、增加数据2、删除数据3、查询数据4、修改数据准备工作先生成两个数据集data = {'city': ...
复制链接

扫一扫

Python爬虫与数据分析 CSDN认证博客专家 CSDN认证企业博客

码龄6年

79: 原创

30万+: 周排名

140万+: 总排名

5万+: 访问

: 等级

969: 积分

79: 粉丝

59: 获赞

29: 评论

399: 收藏

私信

关注

热门文章

分类专栏

python 4篇
逆向 4篇
爬虫 8篇
办公自动化 4篇
可视化 1篇

最新评论

量化体系(二) | 分时交易数据
GGLZSG: 大神，图太糊了，可否手把手教一下，url 和 payload怎么在F12里找到? 我是连目标网站的代码也看不明白的白菜。
量化体系(二) | 分时交易数据
zxy20020225: 请问这个程序怎么获取？
Echarts实现可视化大屏
ペ小小怪プ: 防火墙关了，为啥还没有呢
Echarts实现可视化大屏
孤陋寡闻的闻: 找到原因了，显示不出来的小伙伴，把防火墙关闭了就可以，不然无法访问CDN地址
Echarts实现可视化大屏
孤陋寡闻的闻: 用pycharm打开，只有框架，没有图像怎么回事大佬

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。