- 博客(1)
- 资源 (4)
- 收藏
- 关注
原创 spark多路输出
实现的功能:按不同的key写到不同的文件名 其中data为kv型的Rdd data.partitionBy(new HashPartitioner(4)).saveAsHadoopFile(outputPath, classOf[String], classOf[String], classOf[RDDMultipleTextOutputFormat]) R
2017-03-02 18:10:11 1597
处理后的ip库
ipku文件为对纯真ip库进行国家,省,市,区县拆分,学校网吧不规范数据处理后的可用文件
ipdata为原始纯真ip库 xuexiao.csv为手工整理的学校网吧对应的地区
2015-11-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人