Pandas模块 -- 实操练习

 

如果对序列进行数学函数的运算,首选numpy模块;

如果对序列做统计运算,首选序列的“方法”,因为序列的“方法”更加丰富,如计算序列的偏度、峰度等,而Numpy模块是没有这样的函数。

 

手工构造数据框DataFrame时,一般首选字典方法。因为通过字典的方法构造数据框,则字典的键构成数据框的变量名。

arr1=pd.DataFrame([['张三',23,''],['李四',27,''],['王二',26,'']])
print(arr1)
print("")
print("对比两种方式的区别:\n")
arr2=pd.DataFrame({'姓名':['张三','李四','王二'],'年龄':[23,27,26],'性别':['','','']})
print(arr2)

 

 

 

构造序列时:pd.Series( )  参数是列表或元组都可以

构造数据框时,pd.DataFrame( )   使用列表或元组构造时,嵌套的最外层必须是列表list,里面一层是列表或元组都可以

 

#外层是元组 括号形式,不能运行,会报错
arr1=pd.DataFrame((('张三',23,''),('李四',27,''),('王二',26,'')))
#下面两种形式 最外层是列表List的都能正常运行
arr2=pd.DataFrame([('张三',23,''),('李四',27,''),('王二',26,'')])
arr3=pd.DataFrame([['张三',23,''],['李四',27,''],['王二',26,'']])

 

 

读取电子表格pd.read_excel(  )时指定header=False,然后报出下面的错误:

TypeError: Passing a bool to header is invalid. Use header=None for no header or header=int or list-like of ints to specify the row(s) making up the column names

 如果不将数据集的第一行作为表头,需要设置header=None,而不能是header=0或header=False

 

转载于:https://www.cnblogs.com/bravesunforever/p/11204369.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值