大数据
给我瓶叶小白
虽千万人吾往矣。
展开
-
初识Hadoop
Hadoop一直是我想学习的技术,正巧最近项目组要做电子商城,我就开始研究Hadoop,虽然最后鉴定Hadoop不适用我们的项目,但是我会继续研究下去,技多不压身。 《Hadoop基础教程》是我读的第一本Hadoop书籍,当然在线只能试读第一章,不过对Hadoop历史、核心技术和应用场景有了初步了解。 Hadoop历史 雏形开始于2002年的Apa转载 2016-09-08 12:41:41 · 199 阅读 · 0 评论 -
Ubuntu上搭建Hadoop环境(附实例)
Ubuntu上搭建Hadoop环境(附实例) 两天的学习后,我们对Hadoop有所了解了,特别是昨天对MapReduce的部分源码进行了分析,知道了MapReduce是怎么运作的,是不是手痒了,很想自己安装Hadoop吧(其实是我自己手痒了...)?那我们今天就先不分析源码,我们就来安装Hadoop(单机集群模式)。以下所有操作均在Ubuntu 11.04下完成。 安装转载 2016-09-08 16:24:15 · 1039 阅读 · 0 评论 -
协同过滤推荐算法
华夏35度Data Mining协同过滤推荐算法Collaborative Filtering Recommendation向量之间的相似度度量向量之间的相似度方法很多了,你可以用距离(各种距离)的倒数,向量夹角,Pearson相关系数等。皮尔森相关系数计算公式如下:ρX,Y=cov(X,Y)σxσy=E((X−μx)(Y−μy))σxσy(1)转载 2016-08-10 23:06:06 · 592 阅读 · 0 评论 -
可视化篇:R语言REmap+Echart做迁徙,通勤图
工作后经常要做一些比较贴合用户级别的可视化,R的ggplot2在做一些学术或者理论研究上的可视化时,效果是非常好,基本上能想到的图ggplot都能画出(不要纠结双坐标和3D) 在作静态图时,ggplot2+AI可以展现出印刷级别的效果,具体可以查看:http://theinformationcapital.com/ 这里要感谢数据人网一位朋友,是他介绍的这本书。 在作动态图或者转载 2016-11-23 16:50:32 · 4398 阅读 · 2 评论 -
区块链通俗解释
最近区块链比较火。最早我是听一个朋友提起的,因为我对科技驱动的东西一直很感兴趣,所以也做了一些了解。简单讲,区块链就是一个去中心化的信任机制。过去区块链主要应用在比特币上,一直到最近半年,区块链已经渐渐开始有了一些其他应用,特别是在金融领域,所以不断有人问我:“给我们讲讲区块链吧”。我今天给大家找来一篇文章,偏科普性质,不需要大家对技术和金融有任何背景,希望对大家有所帮助。问:什么是区块链?答:...转载 2018-03-08 09:34:56 · 7340 阅读 · 0 评论