hive
木下瞳
这个作者很懒,什么都没留下…
展开
-
hivesql 文本日期选择一个月以内的数据
在数据库里面的时间格式为【文本】,形式【20211211】,需要选择距离现在一个月以内的数据select *from tablewhere date >= regexp_replace(date_sub(now(),30),'-','')原创 2021-12-12 16:40:15 · 1820 阅读 · 0 评论 -
hive 正则(regexp)表达式匹配中文或者字符
https://blog.csdn.net/Chao_Qing/article/details/106215212如有一列【地区】,取值都类似【北京/上海】,需要提取前面的北京,及匹配中文select regexp_extract(地区,'[\\u4e00-\\u9fa5]+',0) as diqufrom cat_info转载 2021-07-25 12:48:50 · 2771 阅读 · 0 评论 -
hive分组随机抽一定量数
https://blog.csdn.net/zwj841558/article/details/71143493每次运行的抽取的结果都不一样转载 2021-07-16 13:03:04 · 268 阅读 · 0 评论 -
hive 删除数据
https://blog.csdn.net/bbbeoy/article/details/62442687转载 2020-07-01 15:07:39 · 778 阅读 · 0 评论 -
python 连接 hive
https://juejin.im/post/5dc4fc646fb9a04ab25be021转载 2020-04-22 15:39:54 · 210 阅读 · 0 评论 -
Hive 不能创建表
问题描述:在虚拟机上,开启 hive 后,创建数据库 a,可以只用 CLI 在数据库 a 创建表,其他操作也可,但用可视化连接后,切换到 a 库,不能创建表,报权限错误,可查询解决:在 hive 配置文件,我的是 /usr/local/hive/conf/hive-site.xml,然后添加权限,我是添加 all 权限,定义为创建表的用户自动授予这个权限<proper...原创 2020-04-04 21:05:55 · 1324 阅读 · 0 评论 -
Hive 报错 cannot recognize input near '<EOF>' '<EOF>' '<EOF>' in subquery source
子查询报的错select movieid,moviename,years,avgrate,type,row_number() over(distribute by type sort by avgrate desc ) as numfrom ( select a.movieid,a.moviename,a.years,a.avgrate,tv.type as type from ( ...原创 2020-04-03 12:39:54 · 9765 阅读 · 0 评论 -
Hive 函数
选取字段中的某几个字符(substr(字段名,start,n))start 从第几个开始选,可以为负数,代表从后面开始n 选取几个对字段值去重(collect_set(字段名))返回一个数组类型,里面是去重后的字段数据...原创 2020-04-02 20:05:47 · 131 阅读 · 0 评论 -
Hive 报错 Invalid column reference 列名
两张表当我执行select m.movieid,m.moviename,substr(m.moviename,-5,4) as years,avg(r.rate) as avgScoreFROM t_movie as m join t_rating as r on m.movieid = r.movieid GROUP by m.movieidHAVING avgSc...原创 2020-04-02 20:00:56 · 42772 阅读 · 0 评论 -
Hive 报错 Expression not in GROUP BY key
https://blog.csdn.net/chinamcafee/article/details/53407505collect_set() 函数解决原创 2020-04-02 15:42:10 · 1171 阅读 · 0 评论 -
Hive 可视化连接工具 DBeaver
win上连接hivehttps://blog.csdn.net/fseast/article/details/100091997照着配置好后hiveserver2 启动,但连接不了,需要启动 yarn 在启动 hiveserver2原创 2020-03-31 10:33:19 · 720 阅读 · 0 评论 -
HiveQL 数据操作
向管理表中装载数据下例中语句从一个本地目录($HOME/employees)载入数据到表中将会创建一个 us 和 ca 分区,注意 HiveQL 是如何应用 HOME 环境变量的overwrite,如果分区目录不存在,先回创建分区目录,再将数据拷贝到该目录下,存在覆盖原来的如果目标是非分区表,那应该省略 partition 子句local 代表本地数据弄到分布式文件系统目标位...原创 2020-03-26 15:13:09 · 722 阅读 · 0 评论 -
HiveQL 数据定义
数据库创建,查看hive> create database zjk;数据库存在会报错,可以用如下方式创建:hive> create database if not exists zjk;查看数据库:hive> show databases;正则筛选需要的数据库名,选出以 z 开头,其他字符结尾(.*)的数据库名hive> show...原创 2020-03-23 18:19:37 · 269 阅读 · 0 评论 -
hive CLI 命令选项
$ hive --help一个简单说明的选项列表,Service List 后面的内容,是提供的服务$ hive--help --service cli显示了 CLI 所提供的选项列表命名空间$hive -define foo=bar定义一个变量 fooset 显示或修改变量值,直接 set 显示全部变量,只截取了部分,还可以...原创 2020-03-22 15:33:16 · 764 阅读 · 0 评论 -
hive 配置 web 界面 hwi
配置:https://fangzheng.xyz/BigData/Hive/4.hive-webui.html#_2-hwi%E7%9A%84%E4%BD%BF%E7%94%A8启动:hive --service hwi在浏览器访问http://ip:9999/hwiip 可以是此虚拟机的用户名...原创 2020-03-22 10:30:43 · 236 阅读 · 0 评论 -
ubuntu 安装 mysql,可视化工具
安装sudo apt-get install mysql-server查看 mysql 是否启动ps -ef|grep mysqld 看看是否有mysqld_safe 和mysqld进程启动sudo service mysql start重启service mysql restartERROR 1698 (28000): Access de...原创 2020-03-20 19:51:37 · 1488 阅读 · 0 评论 -
hive启动出现权限错误 /tmp/hive on HDFS should be writable.
https://blog.csdn.net/u014432433/article/details/51226582转载 2020-03-18 22:15:24 · 672 阅读 · 0 评论