目录
1. 简介
在Python数据分析中,DataFrame是一个重要的数据结构,它提供了一种灵活的方式来处理、操作和分析结构化数据。DataFrame可以看作是一种二维表格,类似于电子表格或关系型数据库中的表格,它具有行索引和列索引,可以存储不同类型的数据(如数值、字符串等)。
2. 创建DataFrame
在Python中,可以使用多种方式来创建DataFrame对象,常用的包括使用列表、字典和CSV文件等。
2.1 使用列表创建DataFrame
可以使用列表来创建DataFrame,其中列表的每个元素可以是一个行的数据,多个列表中的元素将对应不同的列。
import pandas as pd
data = [['Alice', 25, 'F'], ['Bob', 30, 'M'], ['Charlie', 35, 'M']]
df = pd.DataFrame(data, columns=['Name', 'Age', 'Gender'])
2.2 使用字典创建DataFrame
可以使用字典来创建DataFrame,其中字典的键可以作为列名,字典的值可以作为每一列的数据。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'Gender': ['F', 'M', 'M']}
df = pd.DataFrame(data)
2.3 从CSV文件创建DataFrame
通常情况下,我们会将数据存储在CSV文件中,然后使用pandas库中的