- 博客(6)
- 资源 (5)
- 收藏
- 关注
原创 HDFS命令指南
https://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-hdfs/HDFSCommands.html#fsck
2019-02-26 22:55:37 105
原创 spark源码导入IDEA
1.官网下载源码包或者github下载源码版本2.下载的tar包解压后,用open的方式导入IDEA3.利用maven安装必要依赖参考:https://www.cnblogs.com/juncaoit/p/6368371.html...
2019-02-26 21:16:54 339
翻译 时间序列分类实践介绍(使用Python代码)
https://www.analyticsvidhya.com/blog/2019/01/introduction-time-series-classification/介绍分类时间序列数据?这真的有可能吗?可能有什么用呢?这些只是您阅读本文标题时必须具备的一些问题。这是公平的 - 当我第一次遇到这个概念时,我有完全相同的想法!我们大多数人的时间序列数据主要涉及产生预测的交易。无论是预...
2019-02-24 16:36:29 4225
原创 spark的coalesce和repartition算子管理分区
源码地址https://github.com/apache/spark/blob/v2.4.0/core/src/main/scala/org/apache/spark/rdd/RDD.scalarepartition: / ** *返回一个具有正确numPartitions分区的新RDD。 * *可以增加或减少此RDD中的并行度。在内部,这使用 *重新分配数据的随机...
2019-02-20 21:13:21 657
翻译 使用Apache Spark设置Tableau的指南
https://community.tableau.com/docs/DOC-7638Apache Spark是大数据分析中最热门的事情,而Tableau是最热门的数据可视化和发现工具之一。将它们组合在一起,您就可以在大数据分析和可视化领域获得潜在的游戏规则改变。 Tableau 9支持与Spark一起使用,但设置并非完全直截了当,直到您正确设置后端组件设置。 技术堆栈 ...
2019-02-11 21:40:26 784
转载 Keras如何保存和载入训练好的模型和参数
1,保存模型:my_model = create_model_function( ...... )my_model.compile( ...... )my_model.fit( ...... )model_name . save( filepath, overwrite: bool=True, include_optimizer: bool=True )filepath:保存的...
2019-02-10 20:37:03 4340
apache-hive-1.1.0-cdh5.7.1-bin.tar.gz
2018-05-22
Java核心必读书(包含面试题).rar
2018-05-10
hadoop-2.6.0-cdh5.7.1.tar.gz(编译版)
2018-05-10
spark-2.2.0-bin-2.6.0-cdh5.7.0.tg
2018-03-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人