目录
11月18日🌻数据预处理 :清洗特征属性
Pandas 数据结构 – DataFrame | 菜鸟教程
1.解题思路
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。
引入Pandas库,使用DataFrame数据结构实现对csv格式下的数据表某一列所有值进行相互间的加减乘除运算,本文用于处理1w5行数据的数据集。
2.代码实例
import pandas as pd
from pandas import read_csv
import row
df1 = pd.read_csv('/Users/yueying/Desktop/shueweicup/ADNIMERGE_New.csv',encoding = 'utf-8')
df2 = pd.DataFrame(df1)
#print (df2)
df3 = df2['Month']/12+df2['AGE']
#print (df3)
df3.to_csv('data1.csv',header=True,index=False,encoding="utf-8")
3.实现结果
4.总结经验
把月份间隔Month除以12得到年份,求得的年份再加上Participants初次参与实验的年龄AGE,可以得到Participants每次参与实验的不同年龄。