打印dataframe的前十行_机器学习 Pandas 06:进阶 前04题 ( 带答案、注释 )

这篇博客介绍了如何在Pandas中打印DataFrame的前十行,并详细讲解了带标签的Series、DataFrame的构建、数据选择以及创建数据等进阶操作。适合机器学习初学者学习。
摘要由CSDN通过智能技术生成

1. 带标签的Series

import pandas as pd
import numpy as np

# Series

s = pd.Series([1,3,6,np.nan,44,1])
print(s)

s = pd.Series([1,3,6,np.nan,44,1],index=[3,4,3,7,8,9])
print(s)

# 默认index从0开始,如果想要按照自己的索引设置,则修改index参数,如:index=[3,4,3,7,8,9]

2. 构建DataFrame

dates = pd.date_range('2018-08-19',periods=6)

df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=['a','b','c','d'])
print(df)

# dates = pd.date_range('2018-08-19',periods=6) 与 dates = pd.date_range('2018-08-19','2018-08-24')等价,第二种方法直接表示起始、结束。
# numpy.random.randn(d0, d1, …, dn)是从标准正态分布中返回一个或多个样本值。
# numpy.random.rand(d0, d1, …, dn)的随机样本位于[0, 1)中。
# (6,4)表示6行4列数据
# DataFrame既有行索引也有列索引, 它可以被看做由Series组成的大字典。
print(df['b'])

# 打印b列数据,其中包括了行索引
df1 = pd.DataFrame(np.arange(12).reshape(3,4))
print(df1)

# 未指定行标签和列标签的数据时,默认行、列标签为从0开始的数字索引。
df2 = pd.DataFrame({
    'A': [1,2,3,4],
    'B': pd.Timestamp('20180819'),
    'C': pd.Series([1,6,9,10],dtype='float32'),
    'D': np.array([3] * 4,dtype='int32'),
    'E': pd.Categorical(['test','train',
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值