大数据
文章平均质量分 54
忙碌的影子
我生活乐观,注重观察,喜欢摄影与跑步,热爱技术,平时更注重个人的反思,提升自己的优点与克服自己的缺点。
展开
-
Hadoop生态圈简单介绍
Hadoop生态地图 网络浏览器:可以理解为海量数据源。 Nutch:一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 HDFS:分布式文件系统(Hadoop Distributed File System),设计有着为大数据处理“私人订制”的意思,提供高吞吐量的数据访问,非常适合大规模数据集上的应用。并...原创 2018-05-25 17:39:17 · 1306 阅读 · 0 评论 -
Scala与Java的互相调用
Java语言的重要性自不必说,Scala运行在JVM上,运行时也会翻译成class字节码文件进行执行,所以两种语言本质上是同源的,互相之间的调用在编程时就显得很重要了。 多两种语言都有所了解的兄弟来说,调用很简单,贴出代码,已做记录 Scala代码 /** * 伴生对象,与类共享名字,可以访问类的私有属性和方法 * 在object中一般可以为伴生类做一些初始化等操作 */ ob...原创 2018-12-27 12:02:17 · 4067 阅读 · 0 评论