【DW组队学习—动手学数据分析】第一章：第二节pandas基础-课程学习

0_×

于 2022-09-13 21:36:39 发布

阅读量274

点赞数 1

分类专栏： DW组队学习数据分析 Pandas 文章标签： pandas 数据分析学习

本文链接：https://blog.csdn.net/sinat_33209811/article/details/126842338

版权

复习：数据分析的第一步，加载数据我们已经学习完毕了。当数据展现在我们面前的时候，我们所要做的第一步就是认识他，今天我们要学习的就是了解字段含义以及初步观察数据。

我们学习pandas的基础操作，那么上一节通过pandas加载之后的数据，其数据类型是什么呢？

开始前导入numpy和pandas

import numpy as np
import pandas as pd

Series

Series是一个一维标记数组，能够保存任何数据类型（整数、字符串、浮点数、Python 对象等）。轴标签统称为index。
创建系列的基本方法是调用：
s = pd.Series(data, index=index)

#写入代码
#创建Series
s = pd.Series(['a','b','c','d']) #默认索引
s

0    a
1    b
2    c
3    d
dtype: object

s = pd.Series(np.random.randn(5), index=["a", "b", "c", "d", "e"]) #指定索引
s

a    0.174499
b    0.826603
c   -0.504941
d    1.154826
e    0.194536
dtype: float64

s = pd.Series({
   "b": 1, "a": 0, "c": 2}) #指定索引
s

b    1
a    0
c    2
dtype: int64

s = pd.Series(5.0, index=["a", "b", "c", "d", "e"]) #相同值
s

a    5.0
b    5.0
c    5.0
d    5.0
e    5.0
dtype: float64

#我们举的例子
sdata = {
   'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}
example_1 = pd.Series(sdata)
example_1

Ohio      35000
Texas     71000
Oregon    16000
Utah       5000
dtype: int64

DataFrame

dataframe是非常常见的一个表格型数据结构，每一列可以是不同的数值类型，有行索引、列索引。提到它就会自然想到Pandas这个包。平常用Python处理xlsx、csv文件，读出来的就是dataframe格式。
DataFrame 接受多种不同类型的输入：

#我们举的例子
data = {
   'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'

关注

专栏目录