文章目录
前言
pandas主要分为如下几个阶段:
表格数据操作:增删改查
实现多个表格的处理
数据清洗操作:缺失值、重复值、异常值、数据标准化、数据转换的操作;
实现所有的excel的特殊操作:生成透视表,交叉表;
完成统计分析;
首先,导入相应模块
import pandas as pd
import numpy as np
一、构建dataframe
dataframe是一种表格型数据结构,拥有axis=0,axis=1(),所以dataframe类型肯定是二维的
方法一:
df = pd.DataFrame(data=[['ss',20,'男','0831'],['zs',22,'男','0831'],['lh',21,'女','0831']], index=['a','b','c'], columns=['name','age','gender','class'])
说明:
index:行索引,可以不写
columns:列索引,必须得写
data:数据
方法二:
pd.DataFrame(data={
'name