《python数据挖掘入门与实践》笔记1

最新推荐文章于 2021-11-09 19:55:39 发布

Joker江

最新推荐文章于 2021-11-09 19:55:39 发布

阅读量2.5k

点赞数

分类专栏： python数据挖掘文章标签： python 数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jokertony/article/details/60967856

版权

1.导入iris植物数据集，包含150个sample。X是一个4元组，包含特征：sepal length、 sepal width、 petal length、 petal width。Y是每个sample的分类情况，分类有三种情况（0，1，2）表示。

from sklearn.datasets import load_iris
dataset=load_iris()
X=dataset.data
Y=dataset.target

2.将连续的数据离散化。以平均值做阈值。

attribute_mean= X.mean(axis=0)
X_d=np.array(X>=attribute_mean,dtype=’int’)

from collections import defaultdict
from operator import itemgetter

3.实现OneR算法。
X是特征集，y_ture是分类信息，feature_index表示用第几个特征来分类，value表示特征值。（zip（）函数：将两个元组一一对应）
train_feature_value函数统计了y类中第feature_index个特征值为value的sample个数

def train_feature_value(X,y_true,feature_index,value):
class_counts=defaultdict(int)
for sample ,y in zip(X,y_true):
if sample[feature_index]==value:
class_counts[y]+=1

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
5
评论
《python数据挖掘入门与实践》笔记1

《python数据挖掘入门与实践》 OneR算法的实现。对四个特征的花瓣数据进行分类。分类的规则可参考OneR算法的内容。
复制链接

扫一扫

专栏目录

博客等级

码龄10年

7
原创

10
点赞

85
收藏

17
粉丝

关注

私信

热门文章

分类专栏

最新评论

matlab 傅里叶变换高斯高通滤波
梅: 请问为什么会出现数组大小不兼容的问题啊？
python 图像处理用中值滤波去除椒盐噪声
Asssshzy: cv2.medianBlur(img, 3) 这样不就行了吗
python 图像处理用中值滤波去除椒盐噪声
A: 怎么处理多张图片呢
matlab 傅里叶变换高斯高通滤波
‭刘燚: 频谱图中心点也就是零频分量的值表示原图灰度的平均值，高通滤波将低频分量置零，中心点也就置零了，转化后的图像灰度平均值也就是零，所以看着显示黑色
matlab 傅里叶变换高斯高通滤波
m0_47613112: 为什么我按照源代码敲上去，原图显示是黑色

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。