自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 数据挖掘算法整合

线性回归模型当变量之间存在互相依赖关系的时候,这时候可以进行回归分析。回归分析与相关分析在理论和方法上具有一致性,变量之间没有关系,就谈不上回归分析或者建立回归方程;相关程度越高,回归效果就越好,而且相关系数和回归系数方向一致,可以互相推算。相关分析中的两个变量之间的地位是对等的,即变量 ???? 与变量 ???? 相关等价于变量 ???? 与变量 ???? 相关,相关分析的两个变量均为随机变量;而回归分析中要确定自变量和因变量,通常情况下只有因变量是随机变量,人们可以利用回归分析来对研究对象进行预测或

2021-11-24 11:21:46 907

原创 Hbase 数据库

1.1 安装HBase的前提条件安装HBase的前提条件是Hadoop已经安装并成功启动1.2 解压并配置环境变量从HBase官网下载HBase的当前版本1.4.13,并使用XFtp复制java安装包至yoseng目录下,解压,移动至java目录下...

2020-11-23 21:17:06 620

原创 精品! hadoop环境配置

1. 虚拟机配置1.1 安装CentOS系统不建议安装CentOS最新版本,安装Centos后修改虚拟机名称为master注:本文使用VMWare进行配置,若使用VirtualBox配置时,除虚拟机网络配置略有不同外,其他一致。1.2 网络连接介绍1.桥接模式:虚拟机和物理机连的是同一个网络,虚拟机和物理机是并列关系,地位是相当的。无论是虚拟系统还是真实系统,只要在同一个网段下,相互之间就能ping通。2.NAT模式:物理机会充当一个“路由器”的角色,虚拟机要想上网,必须经过物理机,那物理机如果

2020-11-02 19:58:31 450

转载 hdfs讲义

Hadoop分布式文件系统—HDFSHDFS原理HDFS(Hadoop Distributed File System)是一个分布式文件系统。它具有高容错性并提供了高吞吐量的数据访问,非常适合大规模数据集上的应用,它提供了一个高度容错性和高吞吐量的海量数据存储解决方案。HDFS在设计时已考虑硬件错误等情况,具有高容错性等特征。HDFS的假设前提术设计目标包括以下几个方面。1.硬件错误硬件错误是常态而不是异常。HDFS 可能由成百上千台服务器构成,每台服务器上存储着文件系统的部分数据。我们面

2020-11-01 21:23:16 370

原创 MapReduce简介

MapReduceMapReduce原理Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架;Mapreduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个hadoop集群上;我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ,将会带来全新的写作体验;在创作中心设置你喜爱的代码高亮样式,M

2020-11-01 21:15:11 3464

原创 大数据认知学习

自我介绍我叫李泽宇,来自兰州文理学院,是一名在校大学生,我主修的专业是数据科学与大数据技术,自己的第一次写博客,先来一个简单的自我介绍。虽然我学的是数据科学与大数据技术专业,但是在上大学之前,本人没有接触过任何有关编程的东西,但是看数据科学与大数据技术这个名字比较的高大上就稀里糊涂的报了,进入大学读书,这一年的时间,感觉自己过的浑浑噩噩的,成绩也不是特别的突出,编程能力也不强,对自己的这个专业也没有很清晰的认识。今天写的是第一篇博客,以后还会不断的写,就因为发现了写博客的好处其实是蛮多的,希望把自己在编程

2020-07-18 14:49:59 742

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除