文章标题
pandas简介
Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。本文重点对pandas的DataFrame创建的不同方式进行展示,并分析其使用场景。
pandas数据结构
1.DataFrame
DataFrame是Pandas中的一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。
2.Series
Series是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。
DdtaFrame的创建
pandas在创建DataFrame的时候,除了通过内置方法pandas.read_csv()或者pandas.read_excel()直接读取.csv文件或者.excel文件进行创建外,还可以通过以下方式进行创建。
1.通过字典的方式创建
示例1:
import pandas as pd
df = pd.DataFrame({'a':[1,2,3], 'b':[4,5,6], 'c':[7,8,9]})
df输出为:
a b c
0 1 4 7
1 2 5 8
2 3 6 9
解释: