数据分析之python数据计算方法上篇(math|numpy)_Backup and share的博客-CSDN博客
本文重点介绍pandas,math和numpy参见上篇>
目录
一、简介与创建
Pandas 是 python 的一个
数据分析包
,属于PyData项目的一部分。
主要数据结构是 Series (一维数据)与 DataFrame(二维数据)
Series是一种类似于一维数组的对象
,
包含一列数据及与其关联的一列数据标签,数据标签即为数据的序列。
DataFrame 是一个表格化的数据结构
,它同时拥有行序号与列序号。
Series 构造方法:pandas.Series( data, index,
name, dtype, copy)
DataFrame 构造方法:pandas.DataFrame( data, index,
columns, dtype, copy)
创建一个 Series
import pandas as pd
s1 = pd.Series([1,3,5,7,6,8])
s1
创建一个 Series,指定索引和列名
import pandas as pd
s2 = pd.Series([1,3,5,7,6,8], index=['a', 'b', 'c' ,'d', 'e', 'f'], name='col')
s2
创建一个 DataFrame
import pandas as pd
df1 = pd.DataFrame([[1, 2], [3, 4]])
df1
创建一个 DataFrame,指定列名
data=[[1,2,3,4,5],[6,7,8,9,0]]
df2 = pd.DataFrame(data, columns=['col1','col2','col3','col4','col5'])
df2
二、基础查询操作
df1.shape #获取行列数 (2, 2)
df1.info() #查看数据信息【列名,记录数,数据类型】
df1.describe()