自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(52)
  • 收藏
  • 关注

原创 获取表结构

Oracle 获取表结构 SELECT b.TABLE_NAME AS tableName, a.column_name AS columnName, a.data_type AS columnType, a.data_length dataLength, a.nullable AS 是否为空 FROM user_tab_columns a, user_col_comments b WHERE a.TABLE_NAME = ‘table_name’ AN.

2022-01-06 15:36:10 941

原创 CLOB数据转换

第一种: Clob clob = rs.getClob("remark");//Java.sql.Clob String detailinfo = ""; if(clob != null){   detailinfo = clob.getSubString((long)1,(int)clob.length()); }第二种: Clob clob = rs.getClob("remark");//java.sql.Clob int i = 0; if (c

2022-01-06 15:21:35 1004

原创 Oracle创建和删除用户和表空间

Oracle创建和删除用户和表空间Oracle创建用户和表空间一、登录到system或其他用户以创建其他用户二、创建数据表空间三、创建用户以及设置密码四、授权给新建的用户Oracle删除用户和表空间Oracle创建用户和表空间登录到system或其他用户以创建其他用户创建数据表空间创建用户并制定表给用户授予权限一、登录到system或其他用户以创建其他用户二、创建数据表空间2.1查看数据库数据文件信息 select * from dba_data_files; CREATE

2021-09-09 17:07:23 554

原创 Vue实现对点击的列表<li>添加class样例

实现思路:设置一个变量 active,然后写成:class="{active:index === active}",然后click的时候,传入index,把active变量的值赋值为index;这样this.active=index,index==‘index’ 返回true,所以class样例生效 <ul> <li v-for="(item,index) in params" @click="meClick(index)" :class="{active:inde

2021-05-27 10:38:51 896

原创 Elasticsearch6.7.2安装踩坑合集(Killed,Permission denied, bootstrap checks failed)

问题:启动时报错或直接killed,如下图一:二:原因:虚拟机内存不足解决办法:调整内存大小修改ES中config目录下的jvm.options文件vim jvm.options将-Xms1g-Xmx1g改为-Xms512m-Xmx512m修改完之后使用elsearch用户启动成功,如下图...

2021-05-17 17:27:49 1743 14

原创 npm run dev 报错:missing script:dev

问题:npm run dev 时报错:missing script :dev解决办法:检查一下该项目文件夹中的package.json文件,如下图:在script里,并没有dev,而是serve,应该用npm run serve命令运行vue项目即可。

2021-05-17 17:08:26 439

原创 Solr设置完复制域搜索无效(可能原因)

当在没有设置复制域之前,已经将索引数据导入,搜索时复制域不可用,需要将索引重新导入

2021-04-07 15:28:09 246

原创 PostgreSql中的单引和双引

MySQL 可以使用单引号(’)或者双引号(")表示值,但是 PG 只能用单引号(’)表示值,PG 的双引号(")是表示系统标识符的,比如表名或者字段名。MySQL可以使用反单引号(`)表示系统标识符,比如表名、字段名,PG 也是不支持的。在pg中的sql,单引号用来标识实际的值,双引号用来标识表名(table name)或列名(column name)等数据库中存在的值。使用单引执行一句query:使用双引执行一句query:综上,使用单引查的是值,双引查的是对应系统标识符在数据库中存在的值

2021-04-07 15:21:23 945

原创 PostgreSQL判断字符串是否包含目标字符串

PostgreSQL判断字符串包含的几种方法:方式一: position(substring in string):position(substring in string)函数:参数一:目标字符串,参数二原字符串,如果包含目标字符串,会返回目标字符串笫一次出现的位置,可以根据返回值是否大于0来判断是否包含目标字符串select position('aa' in 'abcd'); position ---------- 0select position('ab' in 'ab

2021-02-22 11:26:19 2753 4

原创 ORA-00600: 内部错误代码

错误实例:生产环境,JAVA程序某功能报错:ORA-00600: 内部错误代码, 参数: [qctcte1], [0], [], [], [], [], [], []问题排查: org.hibernate.exception.GenericJDBCException: ORA-00600: 内部错误代码, 参数: [qctcte1], [0], [], [], [], [], [], [], [], [], [], []问题SQL语句:select count(*)from (selec

2021-01-19 14:15:31 10967 1

原创 xml查询报错: ERROR. token : FROM, pos : 77

错误描述:Caused by: com.alibaba.druid.sql.parser.ParserException: ERROR. token : FROM, pos : 77解决: sql语句中select后面字段问题,写的时候忘了写字段,也有可能是字段后多个问号select from SCM_BAZHOU.LEADER_PERSON_INFO...

2020-11-19 16:35:23 19737 1

转载 【项目】数仓项目(十)

一、数仓搭建 - ADS 层1.1 设备主题1.1.1 活跃设备数(日、周、月)需求定义:日活:当日活跃的设备数周活:当周活跃的设备数月活:当月活跃的设备数1)建表语句drop table if exists ads_uv_count;create external table ads_uv_count(`dt` string COMMENT '统计日期',`day_count` bigint COMMENT '当日用户数量',`wk_count` bigint C

2020-11-14 15:09:51 16728

转载 【项目】数仓项目(九)

一、数仓搭建 - DWS 层1.1 业务术语1)用户用户以设备为判断标准,在移动统计中,每个独立设备认为是一个独立用户。Android系统根据 IMEI 号,IOS 系统根据 OpenUDID 来标识一个独立用户,每部手机一个用户2)新增用户首次联网使用应用的用户。如果一个用户首次打开某 APP,那这个用户定义为新增用户;卸载再安装的设备,不会被算作一次新增。新增用户包括日新增用户、周新增用户、月新增用户3)活跃用户打开应用的用户即为活跃用户,不考虑用户的使用情况。每天一台设备打

2020-11-14 14:59:45 17093

转载 【项目】数仓项目(八)

1.1 DWD 层(业务数据)1.1.1 商品维度表(全量表)1)建表语句DROP TABLE IF EXISTS `dwd_dim_sku_info`;CREATE EXTERNAL TABLE `dwd_dim_sku_info` (`id` string COMMENT '商品 id',`spu_id` string COMMENT 'spuid',`price` double COMMENT '商品价格',`sku_name` string COMMENT '商品名称'

2020-11-14 14:48:53 17631

转载 【项目】数仓项目(七)

一、数仓搭建 - DWD 层1)对用户行为数据解析 2)对核心数据进行判空过滤 3)对业务数据采用维度模型重新建模,即维度退化1.1 DWD 层(用户行为启动表数据解析)1.1.1 创建启动表1)建表语句drop table if exists dwd_start_log;CREATE EXTERNAL TABLE dwd_start_log(`mid_id` string,`user_id` string,`version_code` string,`version_

2020-11-14 14:24:12 16862

转载 【项目】数仓项目(六)

一、数仓分层1.1 为什么要分层1.2 数据集市与数据仓库概念1.3 数仓命名规范1.3.1 表命名ODS层命名为ods_表名 DWD层命名为dwd_dim/fact_表名 DWS层命名为dws_表名 DWT层命名为dwt_购物车 ADS层命名为ads_表名 临时表命名为xxx_tmp 用户行为表,以log为后缀1.3.2 脚本命名数据源_to_目标_db/log.sh 用户行为脚本以log为后缀;业务数据脚本以db为后缀二、数仓理论2.1 范式理...

2020-11-12 17:07:42 18190

转载 【项目】数仓项目(五)

一、电商业务简介1.1 电商业务流程1.2 电商常识(SKU、SPU)SKU=Stock Keeping Unit(库存量基本单位)。现在已经被引申为产品统一编号的简称,每种产品均对应有唯一的 SKU 号SPU(Standard Product Unit):是商品信息聚合的最小单位,是一组可复用、易检索的标准化信息集合例如:iPhoneX 手机就是 SPU。一台银色、128G 内存的、支持联通网络的 iPhoneX,就是 SKUSPU 表示一类商品。好处就是:可以共用商品图片,海

2020-11-12 14:10:27 18073 2

转载 【项目】数仓项目(四)

总结1)数仓概念总结【1】数据仓库的输入数据源和输出系统分别是什么?输入系统:埋点产生的用户行为数据、JavaEE 后台产生的业务数据输出系统:报表系统、用户画像系统、推荐系统2)项目需求及架构总结【1】集群规模计算【2】框架版本选型1)Apache:运维麻烦,组件间兼容性需要自己调研。(一般大厂使用,技术实力雄厚,有专业的运维人员)(建议使用)2)CDH:国内使用最多的版本,但 CM 不开源,但其实对中、小公司使用来说没有影响3)HDP:开源,可以进行二次开发

2020-11-12 13:54:26 17279

转载 【项目】数仓项目(三)

【1】Linux环境搭建Linux配置请看这篇博客????Linux基本配置【2】Hadoop环境搭建一、数据采集模块1)基础环境创建[node01]cd ~mkdir bincd binvim xsync=======================脚本如下========================#!/bin/bash#1 获取输入参数个数,如果没有参数,直接退出pcount=$#if((pcount==0)); thenecho no args;

2020-11-12 13:44:34 17335

转载 【项目】数仓项目(二)

一、数据生成模块1)埋点数据基本格式公共字段:基本所有安卓手机都包含的字段 业务(事件)字段:埋点上报的字段,有具体的业务类型示例如下????2)示例日志(服务器时间戳 | 日志)如下????注意:事件字段包含多个用户行为数据3)事件日志数据【3.1】商品列表页(loading)事件名称:loading标签 含义 action 动作:开始加载=1,加载成功=2,加载失败=3 loading_time 加载时长:计算下拉开始到接口返回数据的时间,

2020-11-12 10:45:51 17434

原创 Linux安装Oracle11G综合版

0、下载Orcle11G Oracle 11G链接:https://pan.baidu.com/s/10jtmbcAsJyj7jxZv9TjVKw提取码: ffgy 1、上传文件到服务器或虚拟机的/soft目录下使用命令:rz –y命令无法使用请:yum install lrzsz -y2、解压文件到install目录: 文本编译器问题,实际两个.unzip linux.x64_11gR2_database_1of2.zip -d …/installunzip lin

2020-11-11 11:10:03 17475 1

原创 高德API调用:地理转换和逆地理转换

Controllerimport cn.o.base.BaseController;import cn.o.base.WebResult;import cn.o.exception.JcException;import cn.o.mapGrids.MapGridsService;import io.swagger.annotations.*;import org.slf4j.Logger;import org.slf4j.LoggerFactory;import org.springfram

2020-11-05 17:16:50 18184

转载 Java任意音频格式转换MP3格式

Maven添加依赖 <!--录音转换,jave-all-deps 包涵了所有平台的依赖,由于打包太大,建议打包时选指定的依赖--><dependency> <groupId>ws.schild</groupId> <artifactId>jave-all-deps</artifactId> <version>2.6.0</version></dependency>直接调用(参数一:需要

2020-11-05 16:56:04 19335

转载 【项目】数仓项目

一、数据仓库数据仓库(Data Warehouse),是为企业所有决策制定过程,提供所有系统数据支持的战略集合通过对数据仓库中数据的分析,可以帮助企业,改进业务流程、控制成本、提高产品质量等数据仓库,并不是数据的最终目 的地,而是为数据最终的目的地做好准备。这些准备包括对数据的:清洗,转义,分类,重组,合并,拆分,统计等等二、项目需求1、用户行为数据采集平台搭建2、...

2020-04-27 22:49:42 18847

原创 Apache Sqoop

目录一、sqoop介绍二、sqoop的安装三、sqoop的导入一、全量导入mysql表数据到HDFS二、全量导入mysql表数据到HIVE方式一:先复制表结构到hive中再导入数据 方式二:直接复制表结构数据到hive三、导入表数据子集(where过滤)四、导入表数据子集(query查询)五、增量导入Append模式增量导入Last...

2019-12-12 16:53:39 18283

原创 HIve调优

目录Fetch抓取(Hive可以避免进行MapReduce)本地模式Group ByCount(distinct)笛卡尔积使用分区剪裁、列剪裁动态分区调整数据倾斜Map数如何适当的增加map数reduce数并行执行严格模式JVM重用推测执行表的优化JoinMapJoinFetch抓取(Hive可以避免进行MapRe...

2019-12-12 16:02:59 17867

原创 Hive的数据压缩与数据存储

目录一、hive的数据压缩MR支持的压缩编码压缩配置参数开启Map输出阶段压缩开启Reduce输出阶段压缩二、hive的数据存储格式列式存储和行式存储TEXTFILE格式ORC格式PARQUET格式三、存储和压缩结合一、hive的数据压缩在实际工作当中,hive当中处理的数据,一般都需要经过压缩,前期我们在学习hadoop的时候,已经配置过ha...

2019-12-12 15:22:01 17739 2

原创 Hive用户自定义函数

一、UDF1.什么是 UDF?1. 当 Hive 提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数(UDF: user-defined function)2.UDF 开发步骤1.新建 JAVA Maven 项目,pom文件中添加 hive-exec-1.1.0.jar 和 hadoop-common-2.6.0.jar 依赖上述代码↓↓↓ <re...

2019-12-04 10:03:20 18262 1

原创 HIVE的安装部署与环境变量的配置

HIVE的安装部署第一步:上传hive-1.1.0-cdh5.14.0.tar.gz第二步:进行解压cd /export/softwarestar -zxvf hive-1.1.0-cdh5.14.0.tar.gz -C ../servers/ 从节点安装mysql(使用yum源进行安装,强烈推荐)**第一步:在线安装mysql相关的软件包yum install mysql ...

2019-11-20 10:24:27 20634 4

原创 Hive基本概念

Hive简介什么是HiveHive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL)。其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,hive可以理解为一个将SQL转换为MapReduce的任务的工具。Hive可以对数据进行存储与计算数据存储依赖于HDFS数据计算依赖于MapRedu...

2019-11-20 09:55:40 19813 1

原创 hadoop当中支持的压缩算法

文件压缩有两大好处,节约磁盘空间,加速数据在网络和磁盘上的传输前面hadoop的版本经过重新编译之后,可以看到hadoop已经支持所有的压缩格式了,剩下的问题就是该如何选择使用这些压缩格式来对MapReduce程序进行压缩可以使用bin/hadoop checknative 来查看编译之后的hadoop支持的各种压缩,如果出现openssl为false,那么就在线安装一下依赖包bin/ha...

2019-11-20 09:43:49 19917 2

原创 MapReduce的combiner

每一个 map 都可能会产生大量的本地输出,Combiner 的作用就是对 map 端的输出先做一次合并,以减少在 map 和 reduce 节点之间的数据传输量,以提高网络IO 性能,是 MapReduce 的一种优化手段之一。combiner 是 MR 程序中 Mapper 和 Reducer 之外的一种组件combiner 组件的父类就是 Reducercombiner 和 reduc...

2019-11-20 09:35:01 19548 1

原创 MapReduce当中的计数器

计数器是收集作业统计信息的有效手段之一,用于质量控制或应用级统计。计数器还可辅助诊断系统故障。如果需要将日志信息传输到map 或reduce 任务, 更好的方法通常是看能否用一个计数器值来记录某一特定事件的发生。对于大型分布式作业而言,使用计数器更为方便。除了因为获取计数器值比输出日志更方便,还有根据计数器值统计特定事件的发生次数要比分析一堆日志文件容易得多。hadoop内置计数器列表...

2019-11-20 09:30:35 20167 1

原创 MapReduce排序以及序列化

序列化(Serialization)是指把结构化对象转化为字节流。反序列化(Deserialization)是序列化的逆过程。把字节流转为结构化对象。 当要在进程间传递对象或持久化对象的时候,就需要序列化对象成字节流反之当要将接收到或从磁盘读取的字节流转换为对象,就要进行反序列化。Java 的序列化(Serializable)是一个重量级序列化框架,一个对象被序列化后,会附带很多额外的信息(...

2019-11-20 09:20:38 19976 5

原创 MapReduce的分区与ReduceTask的数量

在MapReduce中,通过指定分区,会将同一个分区的数据发送到同一个reduce中,例如为了数据的统计,可以把一批类似的数据发 送到同一个reduce当中去,在同一个reduce中统计相同类型的数据,就可以实现类似数据的分区,统计等直观的说就是相同类型的数据,送到一起去处理,在reduce当中默认分区只有1个。MapReduce当中的分区类图​​​​​​...

2019-11-20 09:15:31 20109 1

原创 MapReduce编程初体验(WordCount)

需求:在给定的文本文件中统计输出每一个单词出现的总次数Map类:package itcast.demo01;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;import java.io.IOExcep...

2019-11-20 08:55:39 20185

原创 HaDoop之MapReduce流程

MapReduce简介及优点MapReduce是一个分布式运算程序的编程框架,是Hadoop数据分析的核心MapReduce的核心思想是将用户编写的逻辑代码和架构中的各个组件整合成一个分布式运算程序,实现一定程序的并行处理海量数据,提高效率海量数据难以在单机上处理,而一旦将单机版程序扩展到集群上进行分布式运行势必将大大增加程序的复杂程度,所以引入MapReduce架构,开发人员可以将精力集...

2019-11-19 11:31:55 21545

原创 大数据组件图谱

2019-11-19 11:15:48 20092 1

原创 MapReduce如何调优

Map的最终效果是什么样(如何让Map达到最优)Map端的最高效率是:尽量减少环形缓冲区flush的次数(减少磁盘IO 的使用次数)如何能够减少环形缓冲区flush的次数:1、加大环形缓冲区的内存2、增大缓冲区阈值的大小 (考虑剩余的空间是不是够系统使用)3、对输出的进行压缩(压缩-解压的过程会消耗CPU)Reduce端的最高效率是:尽量减少环形缓冲区flush的次数尽量将所有的数...

2019-11-19 08:52:25 20766

原创 Namenode的故障恢复

cp /old/CentOS-Media.repo . ​ mv CentOS-Media.repo local.repo

2019-11-11 20:46:50 21815 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除