大数据
TerryWater
不知道自己什么时候会死,不知道什么是神仙,不知道什么是佛,只知道自己现在活着,那么,就做活着的事情,做人的事情,快乐和痛苦都是做人的享受!
很不喜欢人间那深深的夜晚,令人心乱的孤寂!那么,在夜晚和孤寂的时候我就写博客!!
展开
-
Tachyon
Tachyon是一个分布式内存文件系统,可以在集群里以访问内存的速度来访问存在tachyon里的文件。把Tachyon是架构在最底层的分布式文件存储和上层的各种计算框架之间的一种中间件。主要职责是将那些不需要落地到DFS里的文件,落地到分布式内存文件系统中,来达到共享内存,从而提高效率。同时可以减少内存冗余,GC时间等。Tachyon架构 Tachyon的架构是传统的Ma转载 2016-02-25 09:53:57 · 503 阅读 · 1 评论 -
ElasticSearch配置详解
1. ElasticSearch配置详解http://blog.csdn.net/paul342/article/details/526926322.转载 2016-11-05 09:49:35 · 368 阅读 · 0 评论 -
数据挖掘、自然语言处理
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:纪路链接:https://www.zhihu.com/question/26391679/answer/33076914来源:知乎各种数据库(mongodb,Hive,Pig,HBase,RedShift),分布式系统(Hadoop, Spark),编程语言(Python和R)都是为其开发的或者擅长处转载 2016-02-29 15:19:47 · 1687 阅读 · 4 评论 -
数学之美 - 机器学习实战 书籍 数据挖掘。
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:李斌链接:https://www.zhihu.com/question/35055219/answer/61180132来源:知乎数据挖掘门外汉,自然语言处理爱好者弱答:首先入门:看《数学之美》吧,作为一个非科班出身的强烈推荐的入门读物,没有其二只有其一,看了它你就知道你要做什么了。关于工具:转载 2016-02-29 14:47:40 · 663 阅读 · 0 评论 -
Python 是一门适合做数据挖掘的语言吗
最近看见两本书,《集体智慧编程》,《 社交网站的数据挖掘与分析》,两本书都是以Python语言来讲解的,都是讲的数据挖掘方面的东西,其中后者还是 2011年Jolt生产效率大奖获奖图书,难道Python很适合 做数据挖掘吗?著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:blurrcat链接:https://www.zhihu.com/ques转载 2016-02-29 14:36:08 · 986 阅读 · 0 评论 -
流式大数据处理 (实时)的三种框架:Storm,Spark和Samza
摘要:许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对Storm、Spark和Samza等三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。Apache Storm在Storm中,先要设计一个用于实时计算的图状结构,我们称之为转载 2016-02-29 14:22:55 · 2034 阅读 · 0 评论 -
55个最实用大数据可视化分析工具
【IT168 技术】近年来,随着云和大数据时代的来临,数据可视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取、归纳并简单的展现。传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。因此,在大数转载 2016-02-29 14:15:20 · 2110 阅读 · 0 评论 -
Google Chart API
http://www.haijd.net/archive/computer/google/google_chart_api/api.html转载 2016-02-29 14:14:04 · 363 阅读 · 0 评论 -
D3 JS 库 - 用来展示数据分析的结果
https://github.com/mbostock/d3/wiki/Gallery转载 2016-02-29 14:08:56 · 813 阅读 · 0 评论 -
大数据论坛
http://www.bigdatabbs.com/forum.php转载 2016-02-29 12:51:14 · 896 阅读 · 0 评论 -
产品推荐算法
1. 基于人口统计学的推荐、基于内容的推荐、协同过滤推荐、基于关联规则的推荐、混合推荐等2.知乎https://www.zhihu.com/question/20326697?utm_campaign=rss&utm_medium=rss&utm_source=rss&utm_content=title3.http://www.cnblogs.com/steve原创 2016-12-03 09:40:11 · 977 阅读 · 0 评论