pandasVSexcel 课程笔记 1-3

B站课程的学习笔记,含部分自己补充知识,课程链接:https://www.bilibili.com/video/av36643275/?p=3


第一课:文件中含自动生成的索引:
1、在读入文件时指定索引列
df = df.read_excel('...',index_col='..')
2、读入后,另写一行设置索引
df = df.set_index('...')

 
第二课: 文件含标题,或非表头数据的行数据:
读入数据时指定header从某一行开始
df = df.read_excel('...',header=1)
注意:程序中行、列等均从0开始,即0,1,2,3,...

 
第三课:行、列、单元格
1、数据类型series(一维数组) 一个序列
生成序列:s1=pd.Series()  s1.data,s1.name,s1.index
例如:L1=[100,200,300]  L2=['X','Y','Z']
         S1=pd.Series(L1,index=L2)
或者:S1=pd.Series([100,200,300],index=['X','Y','Z'])
 
2、数据类型dic(字典)
  dic是python中唯一的一个映射类型,是以{}括起来的键、值、对组成,dict中key是唯一的,在保存时,根据key来计算出一个内存地址,然后将key-value保存在这个地址中,这种算法被称为hash算法。所以dict中key必须是可hash的。 已知的可哈希(不可变)的数据类型: int, str, tuple, bool; 不可哈希(可变)的数据类型: list, dict, set
d={'x':100,'y':200,'z':300}  d.keys  d.values
 
3、将dict转换为series
s1=pd.Series(d)
4、将series序列加入dataframe,再设置成以行或列的形式加入
DataFrame类型:DataFrame是一个表格型的数据类型,每列值类型可以不同。既有行索引也有列索引。常用于表达二维数据,也可以表达多维数据。
(1)以列的形式加入:df=pd.DataFrame[{s1.name:s1,s2.name:s2,s3.name:s3}]
(2)以行的形式加入:df=pd.DataFrame([s1,s2,s3])
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值