python的name属性_Series创建,name,index(索引),values(值),dtype等属性

数组:

数组的概念可以看做是一群数据的集合,有点类似python的列表、元组,但是并不相同。在pandas中提到数组一般指的是ndarray(numpy中的数组)

Series数据结构

1、Series是一个一维数组(带有索引,索引可以为数值也可以为标签(比如a、b、c)),能够保存任何数据类型(整数、字符串、浮点数、Python对象等)。

2、Series和DataFrame都有索引,只不过DataFrame同时有列和行索引。

3、Series相比ndarray多了一个索引,相当于一位数组+索引。

4、Series和dict相比,Series更像有顺序的字典,其中字典的key就是索引,索引可以是数字也可以是字母。

5、Series有索引,也有name属性(可以理解为excel的一列的表头)

6、只看Series的值,就是ndarray数组

Series创建(通过字典、数组、标量):

1、通过字典创建,字典的键就是索引,值就是值。也可以人为指定了index(索引),如果指定的index没有对应的值,那么就会用缺失值(空值)替代。

# -*- coding: utf-8 -*-

import pandas as pd

# 通过dict创建

d = {'A': 1, 'B': 0, 'C': 2}

s = pd.Series(d)

print(s)

print('==================')

s2 = pd.Series(d, index=['A', 'B', 'c', 'd'])

print(s2)

A 1

B 0

C 2

dtype: int64

==================

A 1.0

B 0.0

c NaN

d NaN

dtype: float64

2、通过数组(np数组、列表、元组等)创建

# -*- coding: utf-8 -*-

import pandas as pd

import numpy as np

# 通过数组创建

arr = np.random.rand(5)

s = pd.Series(arr)

print(s)

print('============')

s2 = pd.Series(arr,index=['a','b',3,4,1])

print(s2)

0 0.543199

1 0.261755

2 0.464825

3 0.119778

4 0.436607

dtype: float64

============

a 0.543199

b 0.261755

3 0.464825

4 0.119778

1 0.436607

dtype: float64

3、通过标量创建

index索引值可以出现相同的,但是应避免这样。

# -*- coding: utf-8 -*-

import pandas as pd

import numpy as np

# 通过标量创建

s = pd.Series(5., index=['a', 'b', 'c', 'd', 'e'])

print(s)

a 5.0

b 5.0

c 5.0

d 5.0

e 5.0

dtype: float64

name属性及rename方法:

1、Series的name属性(相当于excel的一列添加了表头名)

2、rename方法修改name

# -*- coding: utf-8 -*-

import pandas as pd

import numpy as np

# 通过标量创建

s = pd.Series(5., index=['a', 'b', 'c', 'd', 'e'],name = '高度')

print(s)

print('-----------')

s.name = '长度'

print(s)

print('-----------')

s = s.rename('宽度')

print(s)

a 5.0

b 5.0

c 5.0

d 5.0

e 5.0

Name: 高度, dtype: float64

-----------

a 5.0

b 5.0

c 5.0

d 5.0

e 5.0

Name: 长度, dtype: float64

-----------

a 5.0

b 5.0

c 5.0

d 5.0

e 5.0

Name: 宽度, dtype: float64

Series的index属性(获取索引)、values属性(获取值)

# -*- coding: utf-8 -*-

import numpy as np

import pandas as pd

arr = np.random.rand(3)

s = pd.Series(arr)

print('s的索引',s.index,type(s.index))

print('把s索引变为列表',list(s.index))

print('s的值',s.values,type(s.values))

print('把s的值变为列表',list(s.values))

s的索引 RangeIndex(start=0, stop=3, step=1)

把s索引变为列表 [0, 1, 2]

s的值 [0.86401824 0.86229577 0.4742213 ]

把s的值变为列表 [0.8640182359257331, 0.8622957709758832, 0.4742213037368106]

我们来综合看一下series的常见属性,其中dtype和dtypes相对比较复杂,我们后面会专门解释:

1

axes

返回行轴标签列表。

2

dtype

返回对象的数据类型(dtype)。

3

dtypes

返回对象的数据类型(dtypes)。

4

empty

如果系列为空,则返回True。

5

ndim

返回底层数据的维数,默认定义:1。

6

size

返回基础数据中的元素数。

7

values

将系列作为ndarray返回。

8

head()

返回前n行。

9

tail()

返回最后n行。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
`read_excel` 是 `pandas` 库提供的用于读取 Excel 文件的函数。它的用法如下: ```python pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, mangle_dupe_cols=True, **kwds) ``` 下面是各参数的含义: - `io`: 文件路径、URL、用于打开文件的文件型对象或者是可打开文件的字符串。例如,`'path/to/file.xlsx'`、`'http://example.com/file.xlsx'`、`BytesIO(raw_data)` 等等。必须指定。 - `sheet_name`: 如果 Excel 文件中有多个 Sheet,指定要读取的 Sheet 名称或索引。默认为 `0`,即读取第一个 Sheet。可以是单个字符串或整数,或者是一个字符串列表或整数列表,以读取多个 Sheet。 - `header`: 指定 Excel 文件中作为列名的行数,默认为 `0`,即第一行。如果没有表头,可以设置为 `None`。 - `names`: 指定列名,如果文件没有列名,则设置为 `None`。 - `index_col`: 指定哪一列作为行索引,可以是列名或列的序号。默认为 `None`,即自动生成行索引。 - `usecols`: 指定需要读取的列,可以是列名或列的序号。默认为读取所有列。 - `squeeze`: 如果数据只包含一个列,返回一个 Series 对象。如果为 `False`,返回一个 DataFrame 对象。默认为 `False`。 - `dtype`: 指定每一列的数据类型,可以是字典或者函数。例如,`dtype={'列名': np.float64}`,或者 `dtype=str`。 - `engine`: 指定用于读取 Excel 文件的引擎。可以是 `xlrd`、`openpyxl` 或 `odfpy`。如果未指定,则根据文件扩展名自动选择引擎。 - `converters`: 将指定列名转为指定的数据类型。例如,`converters={'列名': str}`。 - `true_values` 和 `false_values`: 指定哪些字符串应该被解析为 `True` 和 `False`。 - `skiprows`: 要跳过的行数,从文件开头开始计数。例如,`skiprows=[0, 1]` 表示跳过前两行。 - `nrows`: 要读取的行数。 - `na_values`: 指定哪些字符串应该被解析为缺失。 - `keep_default_na`: 是否保留默认的缺失。默认为 `True`。 - `verbose`: 是否打印读取过程中的详细信息。默认为 `False`。 - `parse_dates`: 将指定的列解析为日期时间。可以是列名或列的序号。默认为 `False`。 - `date_parser`: 用于解析日期时间的函数。 - `thousands`: 指定千位分隔符。 - `comment`: 指定注释符号。 - `skipfooter`: 跳过文件末尾的行数。 - `convert_float`: 是否将浮点数转为整数。默认为 `True`。 - `mangle_dupe_cols`: 是否重命名重复的列名。默认为 `True`。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值