scala
安静的数据流
这个作者很懒,什么都没留下…
展开
-
将本地开发好的大数据程序打包到linux服务端运行
1.去掉本地代码中setMaster("local[5]")2.用maven在本地编译代码: maven clean package -DskipTests3.服务端运行 spark-submit --master local[5]\ //本地模式启动spark--jars $(echo /home/hadoop/app/hbase-1.2.0-cdh5.7.0/lib/*....原创 2018-06-06 15:11:57 · 421 阅读 · 0 评论 -
idea开发工具无法导入maven内包含包
1.idea 排除掉了此包2.自己定义的包名是否跟系统的冲突原创 2018-05-31 10:24:20 · 399 阅读 · 0 评论 -
spark scala dataframe 窗户函数Window的应用 实现row_number() over(partition by , order by )
需要引入的包: import org.apache.spark.sql.expressions.Window import org.apache.spark.sql.functions._ //scala实现row_number() over(partition by , order by ) val w = Window.partitionBy($"prediction").o...原创 2019-04-02 14:47:43 · 3844 阅读 · 0 评论 -
windows开发环境运行正常,打包jar到linux系统出现,java.io.FileNotFoundException: xxx.jar! xxx.txt (没有文件或目录)
解决: 1.利用流的方式读取文件 ImputStream inputStream2 = this.getClass.getClassLoader.getResourceAsStream(“dict/xxx.txt”) BufferedReader reader2 = new BufferedReader(new InputStreamReader(inputStream2,"UTF-8")) ...原创 2019-07-16 15:18:31 · 1900 阅读 · 0 评论