-
series对象
1. 列表创建series对象
# pandas.Series
list = ['yqw', '加油', '学习']
s1 = pd.Series(list, index=['名字', '修饰词', '动词'])
print(s1)
print('===============================================')
2. 字典创建series对象
# 还可以用字典创建Series
dic = {'名字': 'yang', '修饰词': '努力', '动词': '学习'}
dic2 = {1: 'yang',2: '努力', 3: '学习'}
s2 = pd.Series(dic, name='序列标题')
print(s2)
print('===============================================')
# 如果只需要字典中一部分数据,可以用索引指定
s3 = pd.Series(dic, index=['名字', '动词'])
s4 = pd.Series(dic2, index=[1,3]) # 需要注意的是这里的索引就是dic的key,不是顺序
print(s3)
print('===============================================')
print(s4)
print('===============================================')
DataFrame对象
1. 嵌套列表创建df对象
# pandas.DataFrame
data = [['1.1', '1.2', '1.3'], ['2.1', '2.2', '2.3'], ['3.1', '3.2', '3.3']]
df = pd.DataFrame(data, columns=['第一列', '第二列', '第三列'],index=[1,2,4]) # 还可以指定dtype
print(df)
2. numpy的ndarray创建df对象
data2 = {'第一列': ['1.1', '1.2', '1.3'], '第二列': ['2.1', '2.2', '2.3'], '第三列': ['3.1', '3.2', '3.3']}
df2 = pd.DataFrame(data2)
print(df2)
3. 字典创建df对象
data3 = [{'第一列': '1.1', '第二列': '1.2', '第三列': '1.3'}, {'第一列': '2.1', '第二列': '2.2', '第三列': '2.3'}, {'第一列': '3.1', '第二列': '3.2', '第三列': '3.3'}]
df3 = pd.DataFrame(data3)
print(df3)
获取DataFrame的行/列
1. 用loc[]按索引/行返回series或dataframe
row1 = df.loc[4] # 原df的索引为1,2,4
row3 = df3.loc[0] # 原df无索引,默认为从0开始
print(row1) # 返回的是series对象,只能返回一列
print(row3)
rows = df3.loc[[0,2]] # 按索引(行)返回df对象
2. 按列返回
rows1 = df3[['第一列', '第三列']] # 按列(name)返回df对象
比较需要注意的是,需要返回序列,只有一个[],需要返回dataframe,需要两个[[]]