#coding=utf-8
def create_data():
#'''创建样本'''
data=[[1,1,'Y'],
[1,1,'Y'],
[1,0,'N'],
[0,1,'N'],
[0,1,'N'],
]
labels=['no surfacing','flippers']
return data,labels
def split_data(data,axis,value):
#根据某一特征划分数据
ret_data=[]
#结果列表
for v in data:
#遍历样本
if v[axis]==value:
#v[axis]样本中第axis的特征,value 预期的特征值
reduced_v=v[:axis]
#样本前axis个值
reduced_v.extend(v[axis+1:])
#样本后axis个值
ret_data.append(reduced_v)
#得到的结果就是除选定的特征外样本中其他的值
#根据需求可返回不同的结果。比如我只想根据axis=1这个条件返回Y or N这个结果
#reduced_v=v[axis+1:] ... ret_data.append(reduced_v) 或者
#单成一个列表 ret_data.extend(v[axis+1:])
return ret_data
简单的划分数据
最新推荐文章于 2024-01-20 17:32:38 发布