Python3--我的代码库之Pandas库之DataFrame(一)

### 一、什么是DataFrame? - 这是一种带名称的表格型的数据结构,我们可以看成很多Series堆砌而成; - 第一行为字段值,从第二行开始每一行为一条记录; - 每一列可以为不同的字段数据类型; - 既有行索引,也有列索引 ### 二、创建一个DataFrame
import pandas as pd
import numpy as np
f = pd.DataFrame([1,2,3,4],[2,3,4,5]) 
f #传入列表时,默认将第一个列表作为记录行标签。
0
21
32
43
54
f.index
Int64Index([2, 3, 4, 5], dtype=’int64’)
f.columns
RangeIndex(start=0, stop=1, step=1)
df = pd.DataFrame({'a':range(100,111),'b':range(200,211)})
df #传入字典值时,一个key值将对应多个value,其中将key作为列标签,value组合成为行记录
ab
0100200
1101201
2102202
3103203
4104204
5105205
6106206
7107207
8108208
9109209
10110210
dict_1 ={'a':{2015:1,2016:2,2017:3},'b':{2015:1,2016:3,2017:4}} 
df = pd.DataFrame(dict_1)
df #外层字典的键(即b和a)作为了列,内层键(即2015,2016,2017)则作为了行索引
ab
201511
201623
201734
dict_1 ={'a':{2015:1,2016:2,2017:3},'b':{2015:1,2016:3,2018:4}}
df = pd.DataFrame(dict_1)
df
ab
20151.01.0
20162.03.0
20173.0NaN
2018NaN4.0
dict_1 ={'b':{2016:1,2015:2,2017:3},'a':{2016:1,2017:3,2015:4}}
df = pd.DataFrame(dict_1)
df # 列名和行索引的排列方式按照升序排列了,和创建dict_1时的顺序不一样,这说明了用字典创建DataFrame时,索引和列名会默认地按照由小到大即升序的方式来排列
ab
201542
201611
201733
df = pd.DataFrame(np.arange(12).reshape(3,4),index=[1,2,3],columns=['A','B','C','D'])
df # index为行标签,columns为列标签
ABCD
10123
24567
3891011
从外部文件中导入.csv文件
df = pd.read_csv("outschool.csv",encoding = 'gbk')
type(df)
pandas.core.frame.DataFrame
df_iloc = df.iloc[:,:8].head(5) #取前八列,前五条记录
把df_iloc保存到 newout 文件中
df_iloc.to_csv("newout.csv")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值