Terry - 专注外贸B2C

GitHub地址:https://github.com/fancyecommerce

产品推荐算法

1. 基于人口统计学的推荐、基于内容的推荐、协同过滤推荐、基于关联规则的推荐、混合推荐等 2.知乎 https://www.zhihu.com/question/20326697?utm_campaign=rss&utm_medium=rss&utm_s...

2016-12-03 09:40:11

阅读数 704

评论数 0

ElasticSearch配置详解

1.   ElasticSearch配置详解 http://blog.csdn.net/paul342/article/details/52692632 2.

2016-11-05 09:49:35

阅读数 278

评论数 0

数据挖掘、自然语言处理

著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:纪路 链接:https://www.zhihu.com/question/26391679/answer/33076914 来源:知乎 各种数据库(mongodb,Hive,Pig,HBase,RedShi...

2016-02-29 15:19:47

阅读数 1000

评论数 4

数学之美 - 机器学习实战 书籍 数据挖掘。

著作权归作者所有。 商业转载请联系作者获得授权,非商业转载请注明出处。 作者:李斌 链接:https://www.zhihu.com/question/35055219/answer/61180132 来源:知乎 数据挖掘门外汉,自然语言处理爱好者弱答: 首先入门:看《数学之美》吧,作为一个非科...

2016-02-29 14:47:40

阅读数 450

评论数 0

Python 是一门适合做数据挖掘的语言吗

最近看见两本书,《集体智慧编程》,《 社交网站的数据挖掘与分析》,两本书都是以Python语言来讲解的,都是讲的数据挖掘方面的东西,其中后者还是 2011年Jolt生产效率大奖获奖图书,难道Python很适合 做数据挖掘吗? 著作权归作者所有。 商业转载请联系作者获得授权,非商业转...

2016-02-29 14:36:08

阅读数 704

评论数 0

流式大数据处理 (实时)的三种框架:Storm,Spark和Samza

摘要:许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对Storm、Spark和Samza等三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。 许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述...

2016-02-29 14:22:55

阅读数 1225

评论数 0

55个最实用大数据可视化分析工具

【IT168 技术】近年来,随着云和大数据时代的来临,数据可视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取、归纳并简单的展现。传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。新型的数据可视化产品必须满足互联网爆发的大数据需求...

2016-02-29 14:15:20

阅读数 1437

评论数 0

Google Chart API

http://www.haijd.net/archive/computer/google/google_chart_api/api.html

2016-02-29 14:14:04

阅读数 245

评论数 0

D3 JS 库 - 用来展示数据分析的结果

https://github.com/mbostock/d3/wiki/Gallery

2016-02-29 14:08:56

阅读数 572

评论数 0

大数据论坛

http://www.bigdatabbs.com/forum.php

2016-02-29 12:51:14

阅读数 595

评论数 0

Tachyon

Tachyon是一个分布式内存文件系统,可以在集群里以访问内存的速度来访问存在tachyon里的文件。把Tachyon是架构在最底层的分布式文件存储和上层的各种计算框架之间的一种中间件。主要职责是将那些不需要落地到DFS里的文件,落地到分布式内存文件系统中,来达到共享内存,从而提高效率。同时可以减...

2016-02-25 09:53:57

阅读数 370

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭