周志华《机器学习》中的西瓜数据集

周志华《机器学习》一书中大量例题习题用到了“西瓜数据集3.0”和“西瓜数据集3.0a”,两个数据集的区别是“西瓜数据集3.0”有离散属性而“西瓜数据集3.0a”都是连续属性。生成这两个数据集的代码如下,运行代码即可生成python数据文件watermelon_3.0.npzwatermelon_3.0a.npz

write_dataset_watermelon3.py

# -*- coding: utf-8 -*-
"""
Created on Mon Aug 27 21:24:11 2018

Write 'Machine Learning, Zhihua Zhou' P84 watermelon_3.0 dataset to
'watermelon_3.0.npy'

@author: weiyx15
"""

''' 
[x]
色泽:乌黑-0, 青绿-1, 浅白-2
根蒂:蜷缩-0, 稍蜷-1, 硬挺-2
敲声:浊响-0, 沉闷-1, 清脆-2
纹理:清晰-0, 稍糊-1, 模糊-2
脐部:凹陷-0, 稍凹-1, 平坦-2
触感:硬滑-0, 软粘-1
密度:<数值>
含糖率:<数值>
[y]
好瓜:是-0, 否-1
'''

import numpy as np

xn_discrete = 6
xn_continuous = 2
yn = 2
x_discrete =  [3, 3, 3, 3, 3, 2]
x = np.array([[1, 0, 0, 0, 0, 0, .697, .46], 
              [0, 0
  • 5
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值