# -*- coding: utf-8 -*-
"""
Created on Thu Oct 24 17:03:08 2019
@author: weiping
"""
import pandas as pd
import numpy as np
data = np.array([[1,3,5,7],
['a','b','c','d'],
[2001,2002,2003,2004]])
df = pd.DataFrame(data.T,columns=['id','ty','year'])
df
df1 = pd.DataFrame(df,columns=['year','id','ty']) # 可以按照列名指定列字段顺序
df1
df2 = pd.DataFrame(df,columns=['year','id','ty','dt'])#传入的列名找不到 就会产生新的空列(值都是 nan)
df2
df2.dt = 33 # 可以给空列赋值 df2['dt'] = 32 也可
df2.dt = range(4)
df2
df2['pp'] = 44 #可以直接给df2 加上一列 pp 但是 不能 直接 df2.pp = 44 这种只能是给空列赋值,尽量不要用这种
df2
df2['pp'] = range(2,6)
df2
df2['pp'] = range(4)
df2
df2.T # 类似矩阵转置,列名会变成 index index 会变成 column
df2.columns #查看 df的列名
df2.values #返回值是 ndarray
利用python进行数据分析pandas_DataFrame1
最新推荐文章于 2023-01-18 22:28:01 发布