数据仓库
nono19nice
这个作者很懒,什么都没留下…
展开
-
HIVE基础创建表和导入、删除语句
一、创建表create table if not exists tmp(date_stat_date datetime comment '统计日期_日期格式',platform string comment '端口',expose_uv bigint comment '曝光uv',avg_e原创 2022-03-29 19:30:50 · 2615 阅读 · 0 评论 -
HIVE 行转列、列转行sql
一、hive 多列转多行-----hive 多列转多行SELECT distinct ds ,channel ,rank , name FROM ( SELECT ds ,channel ,MAP( '1' ,prev_n原创 2022-03-29 19:25:55 · 2266 阅读 · 0 评论 -
数据挖掘分析相关面试题(亲身经历),持续更新中(最新一次为20210209)
以下大多数都是博主或者博主同事经历过的面试题哟~关于工作内容的就不写啦,一些基础面试题跟大家分享下多看看面试题也能够让你快速了解自己的能力和短缺的地方哦~本篇博客会持续更新,也希望大家多多提供一些面试题哦~1、基础面试(1)自我介绍:emmm这个就不多讲啦,把大概背景讲清楚就可以(2)自己做过的项目介绍:大家可以选择最能够体现自己能力的项目。可以从以下几个方面来讲:a、简...原创 2018-04-13 17:50:20 · 22030 阅读 · 6 评论 -
HIVE udf、udaf、udtf函数定义与用法(最全!!!!!)
一、定义1、hive udf、udaf、udtf函数定义与用法(1)UDF(user-defined function)作用于单个数据行,产生一个数据行作为输出。(数学函数,字符串函数)(2)UDAF(用户定义聚集函数 User- Defined Aggregation Funcation):接收多个输入数据行,并产生一个输出数据行。(count,max)(3)UDTF(表格生成函数 User-Defined Table Functions):接收一行输入,输出(explode)总结:原创 2021-02-08 11:37:20 · 5440 阅读 · 0 评论 -
HIVE 计算连续n天登陆的用户
----用户连续n天登陆天数SELECT device_id ,diff_date --根据连续登陆的起始日期计算连续登陆天数 ,COUNT(ds)FROM ( SELECT device_id ,ds ,ROW_NUMBER() OVER (PARTITION BY device_id ORDER BY ds ) rnk ---计算当前日期 在 统计时间.原创 2021-02-08 10:58:39 · 850 阅读 · 1 评论 -
mysql安装教程及踩过的坑
安装mysql 5.6及踩过的坑解释:由于5.7版本更新了较多语法,安装也有所不同,没有mysql_default.ini文件,具体怎么安装还没试过。所以博主暂时只安装了5.6版本。安装环境:win7+64下载地址:https://dev.mysql.com/downloads/mysql/第一步:下载完以后解压,然后开始改配置文件,找到my-default.ini 将其名字改为my.ini,并在...原创 2018-04-13 16:01:50 · 437 阅读 · 0 评论 -
MAC 安装mysql 连接驱动ODBC时安装错误
应用场景:使用tableau连接时mysql时,提示需要安装驱动,如下图然后需要安装连接驱动,odbc下载地址:https://dev.mysql.com/downloads/connector/odbc/原因:未安装odbc管理器下载地址:http://www.odbcmanager.net/ 下载好后,直接安装,显示安装成功,不用像教程那样改配置,然后再去安装mysql 5.3.10 显示成功...原创 2018-04-23 18:49:17 · 5607 阅读 · 0 评论 -
Mac Kettle安装教程
第一步:先安装jdkhttp://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html下载mac版的,下载好后,直接安装,直到最后一步就可以了打开终端,输入 java -version,查看是否安装成功,如图为安装成功的图第二步:下载kettlehttps://community.hds.com/d...原创 2018-04-23 19:06:11 · 10256 阅读 · 11 评论