![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 96
SunChao3555
请找到我,到了对的时候
https://www.lfd.uci.edu/~gohlke/pythonlibs/
展开
-
Apriori算法实现 python
Apriori:使用逐层迭代方法基于候选产生找出频繁项集输入:D:事务数据库 min_support:最小支持度阈值【p(AB)】输出:L,D中的频繁项集方法:L1=find_frequent_1_itemsets(D) for(k=2;Lk-1 != Null;k++){ Ck=apriori_generate(Lk-1) for...原创 2018-09-08 17:00:58 · 726 阅读 · 0 评论 -
Orange数据挖掘工具介绍
Orange3 使用一、Orange3数据挖掘工具的介绍 官方网址:https://orange.biolab.si/ 正如首页介绍的那样:它是一个面向新手和专家的开源的机器学习和数据可视化工具,带有很多用于数据挖掘或机器学习模型的交互式数据分析工作流程;另外,它绑定了Python语言进行脚本开发。包含一系列数据挖掘流程的组件,比如数据预处理,建模,模型评估以及可视化...原创 2018-12-12 16:56:50 · 30258 阅读 · 3 评论 -
核密度估计
---PRML假设观测服从D维空间的某个未知的概率密度分布p(x)。我们把这个D维空间选择成欧⼏⾥得空间,并且我们想估计p(x)的值。根据我们之前对于局部性的讨论,让我们考虑包 含x的某个⼩区域R。这个区域的概率质量为现在假设收集了服从p(x)的N次观测。由于每个数据点都有一个落在区域R中的概率P,显然位于区域R内部的数据点的总数K将服从二项分布根据二项分布的期望[ E(x)...原创 2018-12-05 21:36:56 · 4949 阅读 · 0 评论 -
docker 安装hadoop2.8.5和spark2.4.0
win7 + docker+ubuntu+java-1.8+hadoop-2.8.5+spark-2.4.0win7系统下,docker的安装,本人是利用Docker Toolbox进行安装参考博客:https://blog.csdn.net/xiangxiezhuren/article/details/79698913下载地址https://docs.docker.com/toolb...原创 2019-02-19 21:09:24 · 926 阅读 · 2 评论