学习路线
为什么要学习pandas
那么问题来了:numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢?
numpy能够帮我们处理处理数值型数据,但是这还不够
很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等
比如:我们通过爬虫获取到了存储在数据库中的数据
比如:之前youtube的例子中除了数值之外还有国家的信息,视频的分类(tag)信息,标题信息等
所以,numpy能够帮助我们处理数值,但是pandas除了处理数值之外(基于numpy),还能够帮助我们处理其他类型的数据
pandas的常用数据类型
1.Series 一维,带标签数组(索引)
2.DataFrame 二维Series容器
pandas之Series创建
pandas之Series切片和索引
pandas之Series的索引和值
pandas之读取外部数据
pd.read_sql(sql_sentence,connection)
读取MangoDB的数据:
pandas之DataFrame
DataFrame二维容器
d1和d2方式都可以创建DataFrame
pandas之取行或者列
pandas之loc
pandas之iloc
pandas之布尔索引
pandas之字符串方法
缺失数据的处理
pandas常用统计方法
数据合并之join
数据合并之merge
分组和聚合
索引和复合索引
Series复合索引
DataFrame复合索引