Python之模块pandas基础知识

最新推荐文章于 2023-12-14 10:57:33 发布

Python-爱好者

最新推荐文章于 2023-12-14 10:57:33 发布

阅读量322

点赞数 1

分类专栏： Python 文章标签： python numpy pandas

本文链接：https://blog.csdn.net/qq_33631384/article/details/118442574

版权

本文介绍了Python数据分析库pandas的基础知识，包括定义一维和二维数组、自定义索引、选择和赋值数据、数据合并、读写CSV文件、基本统计操作及数据清洗方法如drop和fillna。

摘要由CSDN通过智能技术生成

import numpy as np    #用于计算
import pandas as pd   #用于数据处理

1、定义数组

(1) 一维数组

data1=pd.Series([1,2,3])
print(data1)

#使用python中的range( , )
data1=pd.Series(range(1,10))
print(data1)
#使用numpy
array1=np.array([1,2,3])
data1=pd.Series(array1)   # numpy数组转pandas数组
data2=pd.Series(np.arange(1,11))
print(data1)
print(data2)

#延伸知识：生成时间学列
#freq：要生成的日期的频次，频次是指两个相邻日期间隔时间，可以是5小时:“5H",1天: "D",3个月："3M"
date_list=pd.date_range(start='20200325',periods=7, freq="7D")   #开始时间、周期、频率
date_list2=pd.date_range(end='20200325',periods=7, freq="7D")   #开始时间、周期、频率  往前推
print (date_list)
print (date_list2)

(2) 二维数组

# 直接定义
data2=pd.DataFrame([
    [1,2,3],
    [4,5,6]
])

# 使用numpy
data2=pd.DataFrame(np.arange(0,6))
data2=pd.DataFrame(np.arange(0,6).reshape((2,3)))
print(data2)

2、自定义索引

(1) 一维数组,index

# 直接给出
data1=pd.Series(range(1,4),index=['a','b','c'])
data1=pd.Series(range(1,4),index=[chr(i) for i in range(97,123)])  #索引为26个小写字母  65-91为大写字母

# 使用python中的range()
data1=pd.Series(['张三','李四','王五'],index=range(1,4))   #元素个数与索引数必须相同

# 使用numpy
data1=pd.Series(['张三','李四','王五'],index=np.arange(1,4))  #索引为numpy数组，必须是一维
print(data1)

(2) 二维数组,行：index= ，列：colums

data2=pd.DataFrame([['张三','张阿姨','张叔叔'],
                    ['李四','李阿姨','李叔叔'],
                    ['王五','王阿姨'

最低0.47元/天解锁文章

Python-爱好者

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python之模块pandas基础知识

import numpy as np #用于计算import pandas as pd #用于数据处理1、定义数组(1) 一维数组data1=pd.Series([1,2,3])print(data1)#使用python中的range( , )data1=pd.Series(range(1,10))print(data1)#使用numpyarray1=np.array([1,2,3])data1=pd.Series(array1) # numpy数组转pandas数组
复制链接

扫一扫