Python之模块pandas基础知识

本文介绍了Python数据分析库pandas的基础知识,包括定义一维和二维数组、自定义索引、选择和赋值数据、数据合并、读写CSV文件、基本统计操作及数据清洗方法如drop和fillna。
摘要由CSDN通过智能技术生成
import numpy as np    #用于计算
import pandas as pd   #用于数据处理

1、定义数组

(1) 一维数组

data1=pd.Series([1,2,3])
print(data1)
#使用python中的range( , )
data1=pd.Series(range(1,10))
print(data1)
#使用numpy
array1=np.array([1,2,3])
data1=pd.Series(array1)   # numpy数组转pandas数组
data2=pd.Series(np.arange(1,11))
print(data1)
print(data2)
#延伸知识:生成时间学列
#freq:要生成的日期的频次,频次是指两个相邻日期间隔时间,可以是5小时:“5H",1天: "D",3个月:"3M"
date_list=pd.date_range(start='20200325',periods=7, freq="7D")   #开始时间、周期、频率
date_list2=pd.date_range(end='20200325',periods=7, freq="7D")   #开始时间、周期、频率  往前推
print (date_list)
print (date_list2)

(2) 二维数组

# 直接定义
data2=pd.DataFrame([
    [1,2,3],
    [4,5,6]
])
# 使用numpy
data2=pd.DataFrame(np.arange(0,6))
data2=pd.DataFrame(np.arange(0,6).reshape((2,3)))
print(data2)

2、自定义索引

(1) 一维数组,index

# 直接给出
data1=pd.Series(range(1,4),index=['a','b','c'])
data1=pd.Series(range(1,4),index=[chr(i) for i in range(97,123)])  #索引为26个小写字母  65-91为大写字母
# 使用python中的range()
data1=pd.Series(['张三','李四','王五'],index=range(1,4))   #元素个数与索引数必须相同
# 使用numpy
data1=pd.Series(['张三','李四','王五'],index=np.arange(1,4))  #索引为numpy数组,必须是一维
print(data1)

(2) 二维数组,行:index= , 列:colums

data2=pd.DataFrame([['张三','张阿姨','张叔叔'],
                    ['李四','李阿姨','李叔叔'],
                    ['王五','王阿姨'
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Python-爱好者

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值