- 博客(2)
- 收藏
- 关注
原创 学习spark:五、Spark SQL, DataFrames and Datasets Guide
Spark SQL是一个用作结构数据处理的一个模块。不像Spark RDD中的API,Spark SQL提供给Spark更多关于数据和计算的信息。从内部来说,Spark SQL提取信息的接口经过额外的优化。有很多方法使用Spark SQL,包括SQL, DataFrames的API和Datasets的API。Spark SQL的计算引擎与语言或者API是独立开的。这种统一意味着开发人员可以很容易在不同的APIs之间来
2016-06-06 17:54:13 942
原创 Java基本数据结构总结
一直没有很仔细的系统学习Java,之前一直用的是python和c/c++,但是既然要走上大数据的道路,那么一定逃脱不开java的。下面在网上找到一些资料并结合相关的书进行整理总结。java.util包,包含集合框架、遗留的 collection 类、事件模型、日期和时间设施、国际化和各种实用工具类(字符串标记生成器、随机数生成器和位数组、日期Date类、堆栈Stack类、向量Vector类等)。集合
2016-06-06 13:17:14 5309 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人