一、数据集:datingTestData.txt,格式如下:
前三个为特征,分别是:
(1)每年获得的飞行常客里程数
(2)玩视频游戏所耗的时间百分比
(3)每周消费的冰淇淋公升数
标签:不喜欢、魅力一般、极具魅力。
二、使用python处理文本文件,转为矩阵形式。
def file2matrix(filename):
fr = open(filename)
numberOfLines = len(fr.readlines()) #get the number of lines in the file
returnMat = zeros((numberOfLines,3)) #prepare matrix to return
classLabelVector = [] #prepare labels return
fr = ope