自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 C4.5决策树算法原理学习

决策树 由于毕业设计的需要,C4.5算法被用来做数据预处理工作,这篇文章主要用于学习决策树相关概念以及C4.5算法的实现。ps:毕设需要的不是构建一个完整的决策树出来,而是得出所有属性的信息增益率,取前几,所以本文主要研究数学概念。 决策树的概念 决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。 从数据产生决策树的机器学习技术叫做决策树学习, 通俗说就是决策树。 一个决策树包含三种类型的节点: 决策节点:通常用矩形框来表示 机会节点:通常用圆圈来表示 终结点:通常用三角形来表示 决策

2021-04-23 19:58:35 1108

原创 小白安装Ubuntu14.04.6+Hadoop2.7.3+Spark2.4.7全记录

安装Hadoop与Spark 参考文章: 零基础Ubuntu16.04+Hadoop2.7.3+Spark2.3.4+Zookeeper3.4.14+HBase2.1.6+Kafka2.11大数据集群配置教程 ps:本篇文章完全参照此参考文件思路,更新一些我在实际操作中遇到的诸多问题。因为毕设需要,我只安装到4.10,即仅安装了hadoop与spark。** 1、环境搭建 虚拟机: VMware Worstation 15 (https://www.baidu.com/link?url=lUpoe9j2G

2021-01-08 01:16:50 524

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除