自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 KMeans算法初识

认识KMeans KMeans是聚类算法,属于无监督学习,在不知数据所属类别及数据量的情况下,依据数据自身所含的特点对数据进行聚类, 实现步骤 ==1.==首先确定一个K值,即我们希望将数据集,一般为数据量的平方根, 2. 从数据集中随机选择k个数据点作为质心。 3. 对数据集中的每个点计算其与每个执行的距离(如欧式距离),离哪个质心越近,就将其划分到质心所属的集合 4. 将所有的数据集归好集合,一共有k个集合,然后重新计算每个集合的质心 5. 如果计算出来的质心和原来的质心距离小于某个设置的阈值(表示重新

2021-04-14 01:05:48 442

原创 对虚拟机磁盘进行扩容

最近在使用java从Kafka消费数据,再将数据导入HBase,之中的数据量在3千多万条,进行数据写入HBase时,发现HBase的HRegionServer服务总是会挂掉,非常纳闷,看到网上说可能是因为虚拟机的磁盘空间不足结果查了一下,发现已经占用了80%多,确实不足,下面对磁盘容量进行扩容     因为其中/dev/mapper/centos-home的空间为24G,但是实际只用的不到1G,所以我的做法是将其压缩出20G,将其添加到centos-root,具体实现步骤如下: 可以先查看自己的目录空间使用

2021-04-10 23:51:29 269

原创 Flume和Kafka的整合

Flume和Kafka的整合

2021-04-01 09:14:18 77

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除