将信息表csv文件读取成矩阵或数组形式
#将信息表csv文件读取成矩阵或数组形式(注:属性值或决策值可为数值,也可为字符串类型)
import numpy as np
import pandas as pd
data = pd.read_csv(filepath_or_buffer='D:/DemoFile/DemoPython/testdata/test2.csv') #读取csv文件
data = data.dropna(axis=0, how='any') # 删除所有包含NaN的行,
y_data = data.loc[:, 'judge'] # df.loc[ 行索引, 列索引]
x_data = data.drop(['judge'], axis=1) #删除judge列(该列为决策列)
arr = np.array(x_data)
arr1 = np.array(y_data)
print(arr) #属性矩阵
print(arr1) #决策列数组