Pandas初级认识

深入浅出Pandas

Series - 数据系列 - 一维数据
DataFrame - 数据窗、数据框、数据表 - 二维数据
Index - 索引 - 为Series和DataFrame提供索引服务

scores = np.random.randint(60, 101, (5, 3))
scores
array([[ 62,  80,  78],
       [ 91,  71,  77],
       [ 99,  71, 100],
       [ 96,  77,  84],
       [ 73,  94,  99]])

通过二维数组构造DataFrame对象

df1 = pd.DataFrame(
    data=scores,
    columns=['Verbal', 'Math', 'English'],
    index=np.arange(1001, 1006)
)
df1
Verbal	Math	English
1001	62	80	78
1002	91	71	77
1003	99	71	100
1004	96	77	84
1005	73	94	99
data = {
   
    'Verbal': scores[:, 0],
    'Math': scores[:, 1],
    'English': scores[:, 2]
}
data
{
   'Verbal': array([62, 91, 99, 96, 73]),
 'Math': array([80, 71, 71, 77, 94]),
 'English': array([ 78,  77, 100,  84,  99])}

通过字典来创建DataFrame对象

df2 = pd.DataFrame(data=data, index=np.arange(1001, 1006))
df2
Verbal	Math	English
1001	62	80	78
1002	91	71	77
1003	99	71	100
1004	96	77	84
1005	73	94	99
import sys
​
sys.getdefaultencoding()
'utf-8'

读取CSV文件的数据创建DataFrame对象

df3 = pd.read_csv(
    '2018年北京积分落户数据.csv',
    index_col='id',  # 设置索引列(哪个列充当索引)
    # encoding='utf-8',  # 设置字符编码方式
    # usecols=['id', 'name', 'company', 'score'],  # 设置需要加载的列
    # nrows=20,  # 设置加载的行数
    
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

喆子玩点数据

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值