机器学习之pandas常用函数笔记

import pandas as pd
food_info=pd.read_csv("food_info.csv")
###将数据传入。指定文件名即可。使用相对路径。
print(type(food_info))
###将数据通过pandas传入,pandas的数据结构就是dataframe 
print(food_info)
print(food_info.dtypes)
###查看数据的结构
###字符值是object的结构
print(help(pd.read_csv))
##查看帮助文档。当不知道函数如何使用的时候。
food_info.head()
###使用head()把数据前五行显示,在默认情况下。
food_info.head(3)
###把数据的前3条显示一下。
###打印数据的列名。
print(food_info.columns)

##打印矩阵的维度
print(food_info.shape)
###取数据,例子中将第一个数据拿到手。
print(food_info.loc[0])
###取数据的切片。
food_info.loc[3:6]
###一列一列的取数据,肢解通过列名取数据。
ndb_col =food_info["NDB_No"]
print(ndb_col)
###这个例子是拿到的NDB_No列的数据。

####也可以将列名赋值给变量通过变量来取出列名
col_name = "NDB_No"
print(food_info[col_name])
###d定位两列。
###将这两个列组成list结构。然后将这两个列作为变量传入就可以了。
print(food_info.columns)

columns = [ 'Water_(g)', 'Energ_Kcal']
print(food_info[columns])

####查找一某些字符结尾

col_names = food_info.columns.tolist()
###将字符型的数据转换成list型的数据。
print(col_names)
#print(food_info.columns)
###可以比较出两者的区别。

###查找以某些字符串结尾。
gram_columns = []
for c in col_names:
    if c.endswith("(g)"):
        gram_columns.append(c)
gram_df = food_info[gram_columns]
print(gram_df.head())
###查看前五行数据
print(gram_df.columns)
###查看里面有的列。
####新加一个列,然后将这个列加入到dataframe中
###也就是新加一个特征。
print(food_info.shape)
Iron_g=water_energy/1000
food_info["Iron_(g)"]=Iron_g
print(food_info.shape)
###特殊函数的使用,例如max().mean(),min()
max_energ_kcal=food_info["Energ_Kcal"].max()
print(max_energ_kcal)
###使用函数进行归一化
normal_fat=food_info["Lipid_Tot_(g)"]/food_info["Lipid_Tot_(g)"].max()
print(normal_fat)
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值