自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (3)
  • 收藏
  • 关注

原创 pyspark读取mysql数据并计算

demo。

2023-10-12 15:42:46 207

原创 使用spark-SQL的thriftserver和beeline的方式连接hive

1. 准备条件① 需要将hive-site.xml文件拷贝到Spark的conf目录下,这样就可以通过这个配置文件找到Hive的元数据以及数据存放位置。② 如果Hive的元数据存放在Mysql中,我们还需要准备好Mysql相关驱动,比如:mysql-connector-java-5.1.35.jar2. 启动参数设置2.1 启动thriftserver: 默认端口是10000,可以自定义设...

2019-09-06 18:31:31 1082

转载 spark sql连接hive的元数据(mysql库)时报错:Specified key was too long; max key length is 767 bytes

问题: spark sql连接hive的元数据(mysql库)时报错:Specified key was too long; max key length is 767 bytes。解决:其实是mysql数据字符集问题,只要修改mysql中hive元数据库的字符集便可,即alter database dbname character set latin1;可是设置后启动时仍然报错,启动命令如...

2019-09-06 17:27:06 231

转载 PostgreSQL的高级特性>窗口函数

这篇文章纯属搬运,特此贴出链接https://www.cnblogs.com/funnyzpc/p/9311281.html#undefined,感谢这位大神。这是pg官网关于***窗口函数***的官方文档链接http://www.postgres.cn/docs/9.3/functions-window.htmlDROP TABLE IF EXISTS "public"."products";...

2019-03-05 17:32:31 663

大数据+oozie+编译依赖doxia-core、doxia-module-twiki

大数据+oozie+编译依赖doxia-core、doxia-module-twiki

2023-05-22

hadoop构建数据仓库

本书讲述在流行的大数据分布式存储和计算平台 Hadoop 上设计实现数据仓库,将传统数据仓库建模与 SQL 开发的简单性与 大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。

2019-03-25

talend手册

talend入门手册,关于CSV文件到数据库的流转过程,任务如何设计运行等

2019-02-19

Hadoop整理面试题

本文档总结了企业面试过程中所有可能遇到的Hadoop生态相关的问题,以及具体的答案

2019-02-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除