Python
文章平均质量分 64
幼稚猿
这个作者很懒,什么都没留下…
展开
-
python 回归方程
下面是7个地区2017年的人均国内生产总值(GDP)和人均消费水平的统计数据: 地区 人均GDP(元) 人均消费水平(元) 北京 22460 7326 辽宁 11226 4490 上海 34547 11546 江西 4851原创 2021-08-15 21:55:12 · 2673 阅读 · 0 评论 -
Apriori算法规则实现
Apriori算法规则实现数据仓库里面包含以下5个记录。设支持度>0.5,置信度>0.7。 id 购买的商品 1 K,C,M,Y,E 2 E,O,L,M,D,Y 3 A,M,K,E 4 K,Y,M,D,L 5 C,O,K,L,E 使用Apri原创 2021-08-15 21:43:19 · 119 阅读 · 0 评论 -
eclipse 搭建Scala开发环境、spark基本框架、spark工作原理以及DAG、Stage、宽窄依赖
目录搭建spark开发环境 Spark框架 Spark工作原理 DAG、Stage、宽窄依赖1. 搭建spark开发环境 首先, 安装好 jdk1.8 的版本,以及安装 eclipse(OXYGNEN.2); 然后,下载和安装Scala IDE插件,具体步骤如下: 第一步,运行软件,点击右上角的IDE选择器,如图:...原创 2019-05-29 23:16:04 · 425 阅读 · 0 评论 -
机器学习的常见分类及常用算法
目录1. 机器学习的概述2. 机器学习系统的特点 3.机器学习常见分类4.机器学习常用算法1. 机器学习概述 机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。...原创 2019-06-01 23:54:40 · 4665 阅读 · 0 评论 -
Hadoop伪分布式配置
1、配置安全组规则,开启服务器端口: 9000、8031、50070、8088,不建议修改hadoop内部指定的端口号2、设置环境变量(把Hadoop 的Home目录添加到系统环境变量里面去) vim ~/.bash_profile 在该文件中把Hadoop的home、bin、sbin目录加到path中去,文件末尾添加如下内容: H...原创 2019-05-09 18:34:25 · 402 阅读 · 0 评论 -
Python 决策树算法原理及实现
决策树算法决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。决策树算法构造决策树来发现数据中蕴涵的分类规则.如何构造精度高、规模小的决策树是决策树算法的核心内容。决策树构造可以分两步进行。第一步,决策树的生成:由训练样本集生成决策树的过程。一般...原创 2019-04-15 22:48:05 · 1060 阅读 · 1 评论 -
Python 无监督聚类算法(K-means)原理和实现
K-means算法 K-means算法是很典型的基于距离的聚类算法,算法采用误差平方和准则函数作为聚类准则函数,也是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。采用距离作为相似性的评价指标,即...原创 2019-04-17 21:18:31 · 1296 阅读 · 1 评论 -
Python 优美的聚类算法
优美的聚类算法 Science作者(Alex Rodriguez, Alessandro Laio)提出一种优美的聚类算法,据实际论文可以识别各种形状的类簇, 并且其超参数很容易确定。算法思想该算法的假设是类簇的中心由一些局部密度比较低的点围绕, 并且这些点距离其他有高局部密度的点的距离都比较大。或者类簇的中心是这样的一类点:它们被很多点围绕(导致局部密度大)...原创 2019-04-20 21:20:16 · 247 阅读 · 0 评论 -
Python KNN算法测试气象数据,预测是否下雨
邻近算法邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一...原创 2019-04-15 22:31:40 · 5272 阅读 · 7 评论 -
Apriori 关联预测分析
Apriori算法 Apriori算法是一种基于关联规则(Association rule)的原理的代表性算法。该算法源自于“啤酒喝尿不湿”的故事,Apriori算法应用广泛,可用于购物篮分析、消费市场价格分析,猜测顾客的消费习惯…… 如下表1,我们通常称其为购物篮交易(market basket transaction)。表中每一行对应一个交易,包含一个唯一标...原创 2021-08-15 21:30:28 · 1106 阅读 · 0 评论