2020-8-22 pandas基本数据类型

import numpy as np
import pandas as pd
from pandas import Series,DataFrame

通过字典中 包含字典 , 创建个DataFrame

dict_city = {
‘shanghai’:{2019:54000,2020:56000},
‘beijing’:{2018:66666,2019:77777}
}

df_city = DataFrame(dict_city)
df_city

增加数据
df.insert()
loc:索引位置
column:列名称
value:值
allow_duplicates:是否允许重复

新增深圳的数据到 df_city 中

df_city.insert(1,‘shenzhen’,[60000,80000,70000])

df_city

df_city.insert(2,‘shenzhen’,[60000,80000,70000],allow_duplicates=True)

df_city

df_city.drio[ [[‘shanghai’,‘beijing’,‘shenzhen’]]

给行列取个名称

df_city.index.name=‘年份’
df_dity.columns.name = ‘城市’
df_city

df_city.index

我们可以单独创建索引对象,用来创建数据

s = Series([1,2,3,4],index=[‘s’,‘b’,‘c’,‘d’])
s.index.name=‘haha’
s
s.index

s2 = Series([2,4,6,7],index=pd.Index([‘a’,‘b’,‘c’,‘d’],name=‘字母’))

s2

创建一个 日期 做索引
pd.date_range()

pd.date_range(start='2018-04-24', end='2018-04-27', periods=3)
             开始日期       结束日期     周期,间隔

?pd.date_range

pd.date_range(start=‘2018-04-24’, end=‘2018-04-29’, periods=3)

pd.date_range(‘2018-4-24’,‘2018-4-30’)

pd.date_range(start=‘2018-4-24’,periods=3)

pd.date_range(end=‘2018-4-24’,periods=3)

data=DataFrame(np.random.randn(365,4),
index=pd.date_range(‘2018-4-24’,periods=365),
columns=‘天,地,玄,黄’.split(’,’))
data

list1 = [‘和啊哈的时候’]
list1

data.loc[‘2019-03-07’]

data.loc[‘2019-07-07’:‘2019-07-09’]

data.loc[‘2019-03’]

data.loc[‘2019’]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值