python
Ruoshuiss
这个作者很懒,什么都没留下…
展开
-
python实现之K-均值聚类
利用python写出一个二维数据模拟器,例如生成500个点。利用k-均值和k-中心点聚类技术对这500个点进行聚类分析。k=4。给出相应的核心代码和实验结果截屏。解题思路:产生500个二维随机点,从数据集中选择随机选择K个值作为初始簇中心,根据每个点与各个簇中心的欧氏距离,将它分配到最相似的簇,不断迭代,直到类中所有对象和形心c(i)之间的误差的平方和保持不变,分配稳定,迭代结束,输出分类原创 2017-07-19 18:51:44 · 5493 阅读 · 1 评论 -
python实现数据预处理之填充缺失值
1、给定一个数据集noise-data-1.txt,该数据集中保护大量的缺失值(空格、不完整值等)。利用“全局常量”、“均值或者中位数”来填充缺失值。原创 2017-12-08 20:07:49 · 8668 阅读 · 1 评论 -
python实现数据预处理之箱光滑
题目: 给定一个数据集waitakere.txt,该数据集中含有大量的噪音数据。具体操作要求:1)该数据集的偶数位均为噪音数据,判断偶数位是否为0,若为0,利用1替换。2)对转换后的数据集进行排序,利用分箱技术来光滑数据。假设有10个桶,实现“用箱均值光滑”、 “用箱中位数光滑”、“用箱边界光滑”三种技术。原创 2017-12-08 20:35:24 · 4953 阅读 · 1 评论 -
python实现之构建朴实贝叶斯分类器
给定一个训练集Training-data.txt,构建ID3(构建决策树时,采用信息增益分裂相应结点)和朴实贝叶斯分类器,并对测试用例作出推断原创 2017-12-08 20:45:40 · 797 阅读 · 0 评论