小牛学堂

大数据云计算,算法

Scala 在大数据处理方面有何优势?

我想大部分应用开发程序员,最关键是看有什么类库合适的方便特定领域的应用开发。就像ruby有rails做web开发,你可以去论证ruby优缺点,但实际上应用开发效率提升很大程度上依靠类库。 现在Spark是大数据领域的杀手级应用框架,BAT,我们现在几个领域巨头的客户(有保密协议不方便透露)都全面使...

2019-01-30 17:02:26

阅读数 70

评论数 0

大数据公司 Splunk 和 Cloudera 的核心竞争力在哪里?

Splunk面向的是细分市场,分析Machine Log,并在上面集成了完整的专用模块。所有用例都是相对专门的领域,因此可以对这些进行专门优化。它的核心竞争力应该是领域知识和抽象,以及相关的优化和功能,而不是大数据。如果我没搞错的话,Splunk刚出的时候是单机的。 Cloudera以及类似的两家...

2019-01-29 17:32:38

阅读数 182

评论数 0

国内有哪些大数据公司?

国内大数据公司名单汇总 大数据近几年来可谓蓬勃发展,它不仅是企业趋势,也是一个改变了人类生活的技术创新。大数据对行业用户的重要性也日益突出。掌握数据资产,进行智能化决策,已成为企业脱颖而出的关键。因此,越来越多的企业开始重视大数据战略布局,并重新定义自己的核心竞争力。本文整理了在中国境内活跃的...

2019-01-28 15:55:49

阅读数 634

评论数 0

案例分析-爬虫(51job网站的信息)

爬虫介绍 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。 网络爬虫主要应用有两个方面,一方面用于检索,例如百度,谷歌等网站;另一方面用于爬...

2019-01-13 16:14:40

阅读数 126

评论数 0

案例分析-电影评分分析

电影评分分析数据原始数据展示json格式说明数据字段含义需求1.每个用户评分最高的10部电影评分信息(用户最喜爱的十部电影)2.每个用户的uid和评分的平均值。3.最大方(评分平均值高)的n个用户的uid和评分平均值。4.最热门的10部电影id和评价次数。5.评价最高的10部电影id和评分均值需求...

2019-01-09 14:42:54

阅读数 320

评论数 0

案例分析-电影评分分析

电影评分分析数据原始数据展示json格式说明数据字段含义需求1.每个用户评分最高的10部电影评分信息(用户最喜爱的十部电影)2.每个用户的uid和评分的平均值。3.最大方(评分平均值高)的n个用户的uid和评分平均值。4.最热门的10部电影id和评价次数。5.评价最高的10部电影id和评分均值需求...

2019-01-08 21:32:24

阅读数 391

评论数 0

mybatis从0到1

mybatis从零到一学习实战依赖的引入配置数据库连接功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公...

2019-01-03 15:37:46

阅读数 82

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭