- 博客(6)
- 资源 (2)
- 收藏
- 关注
原创 本地jar包安装到本地仓库
使用场景:例如IKAnalyzer是一个分词工具包,但是maven中央仓库没有此jar包。 此时我们可以两种方式解决此问题: 1:build path 添加jar 2:将该jar安装到本地maven仓库 mvn install:install-file -Dfile=jarIKAnalyzer包的局对路径 -DgroupId=IKAnalyzer -DartifactId
2016-12-25 10:14:21 1984
转载 Scala学习---包和引入
转至:http://www.cnblogs.com/sunddenly/p/4436897.html 包和引入 摘要: 在本篇中,你将会了解到Scala中的包和引入语句是如何工作的。相比Java不论是包还是引入都更加符合常规,也更灵活一些。本篇的要点包括: 1. 包也可以像内部类那样嵌套 2. 包路径
2016-12-23 11:05:14 588
转载 Spark性能相关参数配置
Spark性能相关参数配置 随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 在Spark的官方文档http://spark.apache.org/docs/latest/configuration.html 中提供了这些可配置参数中相当大一部分的说明. 但是文档的更新总是落后于代码的开发的, 还有一些配置参数没有来得及被添加到这个文档中, 最重要的是在
2016-12-02 10:02:59 733 1
原创 Spark 重分区函数:coalesce和repartition区别与实现,可以优化Spark程序性能
源码包路径: org.apache.spark.rdd.RDD coalesce函数: 方法注释: Return a new RDDthat is reduced into numPartitions partitions. This results in a narrowdependency, e.g. if you go from 1000 p
2016-12-02 09:15:09 27250
原创 Spark Streaming Kafka CreateDirectDStreaming 遇见的问题
问题1: spark-submit 提交任务报错如下: 分析:起初我的spark 集群是部署在yarn上,所以在spark-env和spark-default下配置了hadoop相关参数。最后我想使用spark standalone模式跑程序,就把spark-env和spark-default下的hadoop相关参数 注释掉了。之后提交程序提示: Exception in thread "
2016-12-01 19:41:55 3745 1
天津大学周伟状态压缩论文
2018-09-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人