数据分析实战之pandas

本文介绍了pandas在数据分析中的应用,包括数据结构Series和DataFrame的特性,数据的导入导出方法,数据清洗的技巧如删除重复值、格式转换等,以及数据统计的基本操作。通过df.describe()可以快速获取统计结果,文章还提到了数据表的合并。
摘要由CSDN通过智能技术生成

一、数据结构Series和Dataframe

1)Series有两个基本结构 index和values。index默认是0,1,2...,可以自己指定索引,也可以用字典的方式创建Sreies

x1 = pd.Series([1,2,3,4])
x2 = pd.Series([1,2,3,4],index = ['a','b','c','d'])
print(x1)
print(x2)

0    1
1    2
2    3
3    4
dtype: int64
a    1
b    2
c    3
d    4
dtype: int64


x3 = pd.Series({'a':1,'b':2,'c':3,'d':4})
x3

a    1
b    2
c    3
d    4
dtype: int64

2)Dataframe结构类似数据库表

包含了行索引和列索引,可以看做是由相同索引的Series组成的字典

data = {'chinese': [66, 95, 93, 90,80],'english': [65, 85, 92, 88, 90],'math': [30, 98, 96, 77, 90]}
d1 = pd.DataFrame(data)
d2 = pd.DataFrame(data,index=['ZhangFei', 'GuanYu''ZhaoYun','HuangZhong','DianWei'],
                       columns = ['english&#
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值