给定数据集datingTest
实验任务:
读取DatingTest的数据文件
import numpy as np
import pandas as pd
file=pd.read_csv("D:\\datingTestSet.txt",header=None,sep='\t',names=['one', 'two', 'three', 'four']) #文件根目录写自己的根目录
print(file)
(1)并输出第一列数据的最大、最小和均值
#并输出第一列数据的最大、最小和均值
first = file['one']
max=first.max()
min=first.min()
avg=first.mean()
print("最大:",max,"最小:",min,"平均值",avg)
(2)输出该文件有多少数据
#输出该文件有多少数据
all=len(file)
print(all)
(3)计算第一条数据和第二条数据的欧式距离。
#计算第一条数据和第二条数据的欧式距离。
ve1=np.array(data[0,0:3])
ve2=np.array(data[1,0:3])
ans=np.sqrt(np.sum(np.square(ve1-ve2)))
print('欧式距离:', ans)
实验结果: