spark
ltylzq
这个作者很懒,什么都没留下…
展开
-
IntelliJ IDEA Spark程序在Local模式下消除日志输出INFO信息
将spark 的jar包下/org/apache/spark/log4j-defaults.properties文件复制一份到Intellij IDEA的src路径下 方法一: 修改log4j.properties文件的内容 将第一行的log4j.rootCategory=INFO, console改成log4j.rootCategory=ERROR, console,只显示E原创 2018-01-11 21:42:56 · 2933 阅读 · 2 评论 -
Spark sql 使用jdbc/odbc Server连接出现新建的数据表多客户端没法共享
当启动多个JDBC/ODBC Server时,经常出现的问题是,连接到其中一个Server的客户端可以看到某个新创建的表,而连接到其他Server的客户端却看不到。这是由于默认的缓存机制导致的,在conf目录下的hive-site.xml配置文件下添加以下配置:<property> <name>datanucleus.cache.level2.type&l...原创 2018-02-27 19:41:03 · 457 阅读 · 0 评论 -
面试准备---------关于Hadoop
1.Hadoop、spark、storm下产品以及应用场景 hadoop起源于Nutch,目标是为了构建一个大型的全网搜索工具或者说是引擎吧,包括网页的抓取、建立索引以及查询等功能。但是,当抓取的内容量越来越大时,单机存储量严重受限。 谷歌的GFS和MapReduce两篇文章给出了可行的方案,其中GFS目的是处理海量数据的存储,而MapReduce目的是处理海量网页的索引计算问题。 ...原创 2018-03-21 15:36:08 · 388 阅读 · 0 评论