原标题:python数据分析之pandas常用命令整理
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型 ,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
导入pandas库:
import pandas as pd
导入Series, DataFrame:
from pandas import Series, DataFrame
pandas常用命令
读取excel文件:
df=pd.read_excel(fpath,sheet_name=name,usecols=[n,m,...])
创建数据表:
pd.DataFrame(dict, columns=dict.index, index=[dict.columnnum])
一、数据表信息查看
1.查看维度:
df.shape
2.查看数据格式
每一列数据的格式:
df.dtypes
查看某一列数据的格式:
df['列名'].dtype
3.查看数据表基本信息(列名称、数据格式、所占空间等):
df.info()
4.判断数据是否是空值:
判断整个数据表数据是否为空值:
df.isnull()
判断某一列数据是否为空值:
df['列名'].isnull()
5.查看某一列的唯一值:
df['列名'].unique()