pandas是为了解决数据分析任务而生的。pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法,能很好的帮助我们分析爬取到的数据。
环境准备
pandas、numpy
本篇所有代码都运行在jupyter上
目录
1、增加数据
2、删除数据
3、查询数据
4、修改数据
准备工作
先生成两个数据集
data = {
'city': ['北京', '上海', '广州', '深圳'],
'2018': [33105, 36011, 22859, 24221]}
data = pd.DataFrame(data)
data2 = {
'city': ['北京', '上海', '广州', '深圳'],
'2017': [28014, 30632, 21503, 22490]}
data2 = pd.DataFrame(data2)
1、增加数据
合并数据
- 方法一:用concat合并
pandas.concat(objs,axis = 0,ignore_index = False,keys = None)
objs:Series,DataFrame或Panel对象的序列或映射。
axis:串联的轴,默认为0,即以索引串联(竖直拼接);如果为1,则以列串联(水平拼接)
ignore_index:清除现有索引并将其重置,默认为False。
key:在数据的最外层添加层次结构索引。
data_new = pd.concat([data, data2], axis=1)
运行结果:
![b9cff5616e5f3b8d0083eeb9b268462e.png](https://img-blog.csdnimg.cn/img_convert/b9cff5616e5f3b8d0083eeb9b268462e.png)
- 方法二:用merge合并
DataFrame.merge(self,right,how =‘inner’,on = None)
right&#