Spark
liuhui_306
这个作者很懒,什么都没留下…
展开
-
error: stable identifier required, but $iwC.this.$VAL4.sqlContext found.
在spark_shell中创建SQLContext对象后导入sqlContext时报了如下异常:查找原因是sqlContext必须是val类型的。修改后导入正常。原创 2014-10-29 11:28:39 · 3233 阅读 · 0 评论 -
Spark RDD API扩展开发(1)
我们都知道,Apache Spark内置了很多操作数据的API。但是很多时候,当我们在现实中开发应用程序的时候,我们需要解决现实中遇到的问题,而这些问题可能在Spark中没有相应的API提供,这时候,我们就需要通过扩展Spark API来实现我们自己的方法。我们可以通过两种方法来扩展Spark API,(1)、其中一种就是在现有的RDD中添加自定义的方法;(2)、第二种就是创建属于我们自己原创 2015-04-23 17:00:02 · 925 阅读 · 0 评论 -
Spark jar包找不到解决方法
今天在使用Spark中DataFrame往Mysql中插入RDD,但是一直报出以下的异常次信息:[itelbog@iteblog ~]$ bin/spark-submit --master local[2] --jars lib/mysql-connector-java-5.1.35.jar --class spark.sparkToJDBC ./spark-test_2.10-1原创 2015-04-24 16:19:57 · 12438 阅读 · 0 评论 -
Spark DataFrame小试牛刀
三月中旬,Spark发布了最新的1.3.0版本,其中最重要的变化,便是DataFrame这个API的推出。DataFrame让Spark具备了处理大规模结构化数据的能力,在比原有的RDD转化方式易用的前提下,计算性能更还快了两倍。这一个小小的API,隐含着Spark希望大一统「大数据江湖」的野心和决心。DataFrame像是一条联结所有主流数据源并自动转化为可并行处理格式的水渠,通过它Spark能原创 2015-04-24 16:13:08 · 1068 阅读 · 0 评论 -
spark一个版本问题引发的血案(java.lang.NoSuchMethodError: org.apache.spark.ui.SparkUI.addStaticHandler)
先看异常:Using Spark's default log4j profile: org/apache/spark/log4j-defaults.propertiesSLF4J: Class path contains multiple SLF4J bindings.SLF4J: Found binding in [jar:file:/home/jerry/.m2/repository/原创 2016-07-09 19:55:22 · 12995 阅读 · 1 评论 -
java.io.IOException: Cannot run program "/etc/hadoop/conf.cloudera.yarn/topology.py" (in directory "
运行clouder yarn-client模式的spark抛异常:16/09/02 17:16:32 WARN net.ScriptBasedMapping: Exception running /etc/hadoop/conf.cloudera.yarn/topology.py 10.55.45.251 java.io.IOException: Cannot run progr原创 2016-09-02 17:22:42 · 9723 阅读 · 4 评论