为了获得《机器学习》(周志华)中的完整西瓜数据集,这里通过Python使用xlwt模块自动生成数据集的Excel文件。
实现代码如下:
import xlwt
def createDataSet():
dataSet = [
# 1
['1', '青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.697, 0.460, '是'],
# 2
['2', '乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.774, 0.376, '是'],
# 3
['3', '乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.634, 0.264, '是'],
# 4
['4', '青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.608, 0.318, '是'],
# 5
[