机器学习之----Pandas(3)

Dataframe  io 操作

import webbrowser
import pandas as pd
from pandas import Series,DataFrame

link='https://pandas.pydata.org/pandas-docs/version/0.20/io.html'
webbrowser.open(link)
df2=pd.read_clipboard()
df2

将df数据保存至文件

#将df数据保存至文件
df2.to_csv('df_file.csv',index=False)

#读取数据集
df3=pd.read_csv('df_file.csv')
df3

将df保存为json模式

#将df数据存储为json格式
df4=df2.to_json()
df4

#读取json数据
pd.read_json(df4)

重新读取出一个表(截图太大不放了)

df=pd.read_csv('data/movie_metadata.csv')
df
df.head() #默认5条
df.head(20)
df.tail(10)
df.shape  #(行,列)
df.shape[0]  #行数

查数据集的相关信息,  iloc--是按照行号查找,loc--是按照行索引查找,相同点:都可以查询多行和多列

a=DataFrame(df,columns=['color','director_name','num_critic_for_reviews'])

df2=df[['color','director_name','num_critic_for_reviews']]#多个列
#指定行
df3=df2.iloc[10:20,0:2]#指定列
df3

df3.loc[12:17]  #是按原索引值提取

如果自己想建一个.csv文件然后读取里面的数,要先将excel的后缀改为.csv,保存选择CSV格式,然后用记事本打开,再另存为utf-8的格式


import webbrowser
import pandas as pd
from pandas import Series,DataFrame
a=pd.read_csv('student1.csv')
a

a.head(5)

#a1=DataFrame(a,index=[1,2,4,5,7])
a1=a.iloc[[1,2,4,5,7],:]
a1

#a2=a1[['name','hight','weight']]
a2=a.loc[[1,2,4,5,7],['name','hight','weight']]
a2

a4=a[a.sex=='female']
a4

#a5=a4[a4.age>20]
a5=a[(a.sex=='female')&(a.age>20)]
a5

#a6=DataFrame(a4,columns=['name','hight','weight'])
a6=a[(a.sex=='female')&(a['age']>20)][['name','hight','weight']]
#a6=a[(a.sex=='female')&(a['age']>20)]['name']
a6



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值