Pandas中Series,DataFrame创建
1.简介Series与DataFrame
Pandas共有两种数据结构,分别是DataFrame 和Series.
DataFrame是一种类似于excel表格的数据格式,有行有列.
从DataFrame中取出一列 则是一个Series.
DataFrame中每一列都是一个不同的数据类型.
2.Pandas的导入
pandas一般与numpy一起使用.
import pandas as pd
3.Pandas中DataFrame的创建
创建方式一:使用Pandas.DataFrame()创建.
import pandas as pd
index1 = ["stu1", "stu2", "stu3", "stu4"]
columns1 = ["姓名", "年龄", "性别", "职业"]
data1 = [['A', 18, '男', '数据分析'],
['B', 19, '男', '机器学习'],
['C', 20, '女', "深度学习"],
['D', 19, '男', "搬砖"],
]
#逐个传入行索引、列索引、数据部分
df = pd.DataFrame(index=index1, columns=columns1, data=data1)
# 创建DF时,可以省略行索引、列索引; 数据部分不能少
# 创建DF时,省略行索引、列索引。默认是0 1 2 3...
# df = pd.DataFrame(data=data1)
创建方式二:使用字典(dict)创建
import pandas as pd
data_dict = {"姓名": ["A", "B", "C", "D"],
"年龄": [18, 19, 20, 19],
"性别": ['男', '男', '女', '男'],
"职业": ['数据分析', '机器学习', "深度学习", "搬砖"]
}
df = pd.DataFrame(data_dict, index=index1)
print("df\n", df)
4.Pandas中Series的创建
创建方式一:使用Pandas.Series()创建.
import pandas as pd
se = pd.Series(index=["stu1", "stu2", "stu3", "stu4"],
data=["A", "B", "C", "D"] )
创建方式二:使用字典类型创建.
import pandas as pd
se = pd.Series({"stu1": "A", "stu2": "B", "stu3": "C", "stu4": "D"})
创建方式三:从DataFrame中取出一列
import pandas as pd
data_dict = {"姓名": ["A", "B", "C", "D"],
"年龄": [18, 19, 20, 19],
"性别": ['男', '男', '女', '男'],
"职业": ['数据分析', '机器学习', "深度学习", "搬砖"]
}
df = pd.DataFrame(data_dict, index=index1)
se=df["姓名"]
print("series\n", se, type(se)