自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 cdh3.6.1安装笔记

cdh3.6.1安装笔记

2022-09-26 14:32:48 777 1

原创 log数据导入kudu步骤

flume-kafka-kudu数据导入

2022-09-26 14:30:36 391

原创 java操作kudu之创建表格

java操作kudu之创建表格第一步:pom依赖第二步:创建类及编写代码package com.kudu.test;import org.apache.kudu.ColumnSchema;import org.apache.kudu.Schema;import org.apache.kudu.Type;import org.apache.kudu.client.CreateTableOptions;import org.apache.kudu.client.KuduClient;imp

2022-05-06 16:06:32 941

原创 Kafka报错:kafka.common.InconsistentBrokerIdException

Kafka报错:kafka.common.InconsistentBrokerIdException问题背景:一台装过kafka的机器再重新安装kafka并启动时(log.dirs没有更改),会报错:FATAL Fatal error during KafkaServer startup. Prepare to shutdown (kafka.server.KafkaServer)kafka.common.InconsistentBrokerIdException: Configured broker

2022-05-06 14:38:56 774 1

原创 HIVE 外部表、内部表、元数据之间的关系

1.创建hive外部表2.mysql的元数据信息select * from TABLE_PARAMS;查看表是否是外部表select * from SDS;记录表的存储路径(默认路径)3.hdfs的存储4.刷新impala的元数据信息5.删除外部表6.刷新impala元数据信息并查表7.mysql元数据信息已被删除,序号140的表信息已删除8.查询hdfs存储路径,数据依然坚挺9.在hive上建立同名的内部表,成功并可查10.删除内部表,mysql的元数据和hdfs

2022-04-01 15:41:31 2312

原创 使用sqoop将greenplum数据全量导入hive和impala

1.链接数据库a.链接greenplumsqoop list-tables --connect jdbc:postgresql://192.168.13.45:5432/bidata --username postgres --password Tengxianfeng198301011b.链接mysqlsqoop list-databases --connect jdbc:mysql://39.105.79.54/bi --username jumpwbx --password jumpwbx12

2022-04-01 09:41:25 2809

原创 Leetcode(Rising Temperature)

一、题目 输出比前一天温度高的序列号。 二、解题 1.SUBDATE()函数SELECT wt1.Id FROM Weather wt1,Weather wt2 WHERE SUBDATE(wt1.RecordDate,interval 1 day)=wt2.RecordDate && wt1.Temperature&gt...

2018-08-29 23:14:52 125

原创 Leetcode(Second Highest Salary)

题外话:做数据分析肯定离不开数据库,之前学了这方面的常用语句,但是不熟练,今天打算重新温习一遍。 一、检索数据 1.SELECT语句 使用SELECT语句必须知道两条信息:想选择什么从什么地方选择...

2018-08-22 09:55:28 122

原创 K-均值聚类算法

题外话:昨天研究了一下内容运营,强行写了一篇自己也不知道对错的水文以后,我决定在真正做数据运营之前不再写这方面的东西了,毕竟质量太差的东西写出来没有成就感,我还是继续写能保证正确的东西吧! 一、K-均值聚类 1.监督学习和无监督学习 学习K-均值聚类算法之前先了解下监督学习和无监督学习。监督学习:生活中到处都是监督学习的例子,比如我们的高考,从小学至高考前的最后一次考试我们一直都在接受...

2018-08-19 20:59:35 1174

原创 利用PCA来简化数据

题外话:之前学习的时候总是喜欢手写笔记,因为喜欢自己的字(自恋脸,溜了溜了……)但是因为只有自己看所以记得乱乱的,昨天写完了人生中的第一篇博客,早上起来无意中发现居然有好几十个人浏览过,心里感觉很开心 ,以后会经常来csdn哒! 一.降维技术 先来了解下什么是降维技术,搞过机器学习的小伙伴都知道这个词,我说说自己的理解,比如说找男朋友,身高、体重、长相、学历、人品、性格、家境、户籍、职业、星座...

2018-08-16 10:50:43 404

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除