前言
本文力求以一个python语言初学者的角度,结合实际项目分析,阐述python学习过程。
一、pandas是什么?
pandas 适用场景:是python 中最重要的数据清洗和分析库,不用使用for循环来处理数据。
pandas 与Numpy 差别:pandas 处理表格和混杂数据;Numpy 处理统一的数值数组数据。
二、基本语法点
1.引入库
代码如下(示例):
#方式一
import pandas as pd
#方式二
from pandas import Series,DataFrame
2.数据结构
1)Series
一维数组对应,有数据标签(索引)与一组数据构成。无索引时会自动创建0~N-1的索引,可以通过指定索引创建索引。
Series具有2个属性,values和index。
#基本结构
#输入自动创建索引
obj = pd.Series([4,7,-5,‘a’])
#输出
0 4
1 7
2 -5
3 a
dtype:object
#输入指定索引
obj = pd.Series([4,7,-5,‘a’], index=[1,