自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

奇迹虎虎的博客

还有什么瓜?一起来吧 ~

  • 博客(68)
  • 资源 (2)
  • 收藏
  • 关注

原创 大数据常用端口及服务启动命令

大数据常用端口&服务启动命令,启动hadoop、yarn、zookeeper、hbase、hive、saprk、hase、kafka等等...

2022-02-19 16:15:22 2154

原创 HDFS的基本shell命令操作

Hadoop HDFS 的基本shell命令操作,涵盖:上传、下载、追加、新建目录、修改副本数等等......

2022-02-18 19:03:38 894

原创 Hive调优及参数优化(详细版)

Hive调优及参数优化,涵盖:基础配置优化、压缩配置优化、分桶优化、Map Join、Bucket-Map Join、SMB Join、Hive并行操作、Hive索引、数据清洗转换优化、统计分析优化、Hive优化器等等......

2022-02-18 13:32:12 13025

原创 Git Windows版的安装与使用(保姆级教程,附案例)

git安装与使用的保姆级教程,图文齐全,一步一步教,小白看了都说好 ~,安装、使用、创建仓库、同步代码、检查代码、创建分支、合并主分支等等...

2022-02-18 00:56:07 30446 2

原创 虚拟机设置时间同步

虚拟机设置时间同步,第一步:先关闭运行中的虚拟机,第二步:右键虚拟机列表,点击“设置”,第三步:点击浮窗顶部选项卡中的“选项”,第四步:在列表中,点击VMare Tools,然后在右侧勾选“将客户机时间与主机同步”,第五步:点击浮窗下方的“确定”,大功告成!

2022-02-18 00:55:07 13637 1

原创 编写sqoop的自动shell脚本完成对hive中ods层的增量数据导入

编写sqoop的自动shell脚本完成对hive中ods层的增量数据导入

2022-02-17 15:24:02 931

原创 导入数据到hive表中,$CONDITIONS的作用(附案例)

如果你想通过并行方式导入结果,每个map task都会执行sql的副本,结果会根据sqoop 推测的边界进行分区。query必须包含$CONDITIONS,这样每个sqoop程序都会被替换成一个独立的条件。同时你必须指定 --split -by 分区。

2022-02-17 15:12:16 800

原创 Hive表插入数据前的优化,分区优化、分桶优化、数据倾斜优化、并行优化等等...

Hive表插入数据前的优化,分区优化、分桶优化、数据倾斜优化、并行优化等等...

2022-02-17 14:32:44 519

原创 Hive表中文乱码问题

Hive表中文乱码问题,第一步:在MySQL中修改,因为MySQL记录维护着元数据,第二步:在 Hive 的 conf 配置文件中的 hive-site.xml 里添加以下内容

2022-02-17 14:22:38 1735

原创 Hive的存储方式和压缩方式,textfile、orc、parquet、snappy、zlib 等等...

Hive的存储方式和压缩方式,textfile、orc、parquet、snappy、zlib 等等...

2022-02-17 12:43:44 1938

原创 Hive开窗函数over()的使用(附案例)

Hive开窗函数over()的使用(附案例),开窗结合sum函数使用,开窗时限定窗口行区间,开窗后获取组内的TOPN,分析函数之 Lag 取前几个,分析函数之 lead 取后几个,分析函数之 first_val 第一个值,分析函数之 last_val 最后一个值,等等...

2022-02-17 12:24:28 685

原创 Hive表中的json处理方式(附案例)

Hive表中的json处理(附案例)

2022-02-17 11:41:51 581

转载 Hive侧视图 Lateral View(单个、多个、outer)(附案例)

Hive侧视图 Lateral View(单个、多个、outer)(附案例)

2022-02-17 01:17:27 5407 1

原创 上传Hive表数据的 “单步插入” 和 “多重插入” 方式(附案例)

上传Hive表数据的 “单步插入” 和 “多重插入” 方式(附案例)

2022-02-17 00:12:09 689

原创 插入Hive表数据用 hdfs dfs -put 和 load data 方式,把hdfs里的文件映射成Hive表(附案例)

hdfs dfs -put 方式(Linux终端上操作,实现hive表映射文件)。load data 方式(SQL上操作,实现文件插入hive表)。

2022-02-17 00:01:36 3823

原创 Hive分桶表创建clustered by()

Hive分桶表创建clustered by()

2022-02-16 23:42:06 883

原创 Hive分区表创建partitioned by()

Hive分区表创建,静态加载,动态加载

2022-02-16 22:39:13 4652

原创 和谐交易形态大全(附图文)

和谐交易是一种基于观测市场价格形态中斐波那契的和谐比率的“基于自然规律的交易”。

2022-02-16 22:18:11 8828

原创 Hive中 case when then 的两种语法结构

case when then​​​​​​​ 的两种语法结构

2022-02-16 21:41:16 2443

原创 Hive时间函数的使用,时间戳与日期之间的转换,获取时间,获取季度等...

Hive时间函数的使用,时间戳与日期之间的转换,获取时间,获取季度等...

2022-02-16 17:55:31 4938

原创 Hive调优(简略版)

Hive调优(简略版),hive分区优化,内存溢出等...

2022-02-16 17:44:09 1594

原创 ApachePhoenix常用命令及基本操作

ApachePhoenix常用命令及基本操作,创表、查表、分页、预分区、索引等等...

2022-02-13 18:37:34 1286

原创 Hive和Spark到底是什么?两者又有什么区别?

Hive和Spark到底是什么?spark是一个计算引擎,而hive是一个存储框架。

2022-02-13 17:02:21 8896 2

原创 Sqoop导入导出操作

Sqoop 导入导出操作,从 mysq 导入数据到 hive,从 hive 导出数据到 mysql

2022-02-13 00:05:12 651

原创 HBase常用命令及基本操作

HBase常用命令及基本操作:创表、删表、查表 等等...

2022-02-12 23:46:51 1237

原创 Kafka常用命令及基本操作

Kafka的基本操作和常用命令,创建主题、创建生产者、创建消费者等等...

2022-02-12 23:27:17 344

原创 Flume常用命令及基本操作(附案例)

Flume常用命令及基本操作(附案例),比如从端口采集数据,或从kafka中采集数据等等...

2022-02-12 16:42:35 4521

原创 大数据思维导图锦集(原创吐血整理,不定期更新)

大数据思维导图锦集,个人原创吐血整理,有助于初学者整理思路与消化知识,知识点涵盖了:数仓理论、Hadoop、Mysql、Hive、Spark、Flink、HBase、Linux 等知识点。后续还会不断新增思维导图,记得收藏喔~

2022-01-26 21:27:23 10312 4

开仓风险计算器.xlsx(可计算:名义价值、最大资金亏损、开仓所需保证金、开仓资金杠杆、最小逐仓保证金等...)

通过输入:总仓保有价值+最大资金亏损+止损位回撤+开仓合约杠杆等必要数据。 可计算出:开仓名义价值 、最大资金亏损、开仓所需保证金、开仓资金杠杆、最小逐仓保证金、U本位需开张数、币本位需开张数。 使用开仓风险计算器,可以加快交易计划的执行效率,更好的控制风险,发现风险。帮助你养成科学做单,控制风险的好习惯,让你不再盲目 all in。 计算器中还附带亏损盈利表,显示了每亏损百分之多少,你需要盈利百分之多少才可以恢复保本。 亏损盈利表的右侧附有计算器的公式解释,你可以变用变理解公式,明白其实计算风险很简单,只是许多人没有用心去弄个计算器罢了。 整体色调我设计成暗色,一是为了护眼,二是为了营造严谨的气氛,让你更专注与解读数字背后带来的潜在风险。 重要的参数,用了青蓝色和亮黄色加以标注。

2022-08-17

某香港大神的程式化交易干货分享

文件密码:12345687 某香港大神的程序化交易干货分享: 1. 如何分解某个指标? 2. 如何利用标准化指标使参数自适应? 3. 如何利用价格维度而不是时间维度来排除市场噪音? 4. 如何围绕一个成本中枢来寻找不同形态结构? 5. 如何构造双自适应通道 6. 常见的资金管理模型本质 PS:本文更多的是分享大神思路,而非死板的均线穿越代码编写,文章引导你思考,思考这样做的方法有何意义,空间去噪和时间去噪又有何区别等等。

2022-02-17

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除