机器学习
潜水的飞鱼baby
just maybe。
展开
-
《集体智慧编中文版》读书笔记——第三章:发现群组
前言发现群组是一个典型无监督学习问题,目的是要在一组数据中找寻某种结构。关于分级聚类分级聚类的算法比较简单,主要步骤如下: 1. 从原数据集中挑选最接近的两个样本作为一个组。 2. 生成该组的中心作为一个赝本加入原数据集中。 3. 重复1,直到数据集只有一个样本。 *见clusters.py中的hclustes。 *缺点:(1)、不会真正将数据项拆分成不同组;(2)、必须计算每两个配对项之原创 2017-11-02 01:26:27 · 379 阅读 · 0 评论 -
给出《Python数据分析与挖掘实战大数据技术丛书》Aprior算法另一种写法
背景关联规则应用,一般是为了寻求:已知某些项在一定概率下推导出另一项,这样的组合。当然在数据量比较小的时候,这样的问题可以穷尽的,但是在数据量比较大时,搜索将成为瓶颈。Aprior算法提出频繁项的子集必须都是频繁,据此设计程序将减少搜索次数。在看《Python数据分析与挖掘实战大数据技术丛书.pdf》,里面实现的Aprior算法有点烦琐,而且未实现剪切步,有提升空间。按自己的思路重写了一...原创 2018-09-23 01:08:01 · 306 阅读 · 0 评论 -
以面向过程的方式给出《贝叶斯思维:统计建模的Python学习法》——第五章:决策分析代码
背景在《艾伯特贝叶斯思维:统计建模的Python学习法.pdf》一书中,代码以面向对象给出,然而为了一本介绍统计思想的书籍,只需要了解其计算逻辑即可(PS:其实是懒得去看书中累的组织过程),因此给出阅读这本书的时候的代码及一些想法。导入常见模块# %load "E:\桌面space\临时数据\python\个人自定义模块\ImportFile.py"# Standard Scientifi...原创 2018-11-18 17:21:34 · 864 阅读 · 0 评论