首先对对数据有一个初步的了解:
**数据:asina_football_data.csv
数据描述:
id :国家对应id
国家:国家名称
2019年国际排名:2019 年国际足联的世界排名。
2018年世界杯:2018 年世界杯中,很多球队没有进入到决赛圈,所以只有进入到决赛圈的球队才有实际的排名。如果是亚洲区预选赛 12 强的球队,排名会设置为 40。如果没有进入亚洲区预选赛 12 强,球队排名会设置为 50。
2015年亚洲杯:真是排名。
**
其次是编写代码有一套的编写思路:
一下五步:
训练模型基本流程及对应要求:
1、获取数据:使用pandas读取数据
2、数据分析:可视化分析
3、数据处理:归一化数据
4、模型训练:利用sklearn中的K-Means算法实现聚类,K=3
5、模型可视化:利用matplotlib包中的方法画出三维图,并按照预测类别的不同,使用不同的颜色表示。
编译运行后的代码呈现的结果:
构造模型图:输入X,Y,Z轴进行数据对应
前题:安装好需要的第三方库
import pandas as pd
//导入工具包
data = pd.read_csv(r"D:/pyCharm/asina_football_data.csv")
//写入文件所在的路径,
print(data.head())
//初步打印出数据读取的结果
train_x = data[['2019年国际排名',