- 博客(5)
- 资源 (7)
- 收藏
- 关注
原创 嗯哼是个nlper酱--LDA学习笔记
非常同意学东西,先学复杂,然后逐步简化的方式。 LDA模型学习系统的学习有一些时间了,闭上眼睛细想一下,似乎能够理解为什么有前辈们说LDA是一个比较简单的学习模型了。up一个学习笔记,记录一下自己在学习完了之后,对LDA各个步骤涉及的数学基础。 一、LDA算法主线 如果想要快速入门+70%理解的话,个人感觉看这一节就好了。本节不会像其他博客那样,从unigram、plsa巴拉巴拉一长串“前菜”
2016-05-15 17:29:11 622
转载 【转】Hadoop自定义输入与输出格式
转自:《Hadoop实战》的笔记-2、Hadoop输入与输出 这一问题本书只在第三章简单说了一下读写HDFS,虽然能说明问题,但是本着第一遍读书应该把书读厚的原则,我觉得很有必要自行展开一番。再说凡是万变不离其宗嘛,任何程序都是从“输入-->计算-->输出”。先说输入,Hadoop的默认的输入方式是将输入的每一行视为一条记录,该行文件偏移量为key,内容为value。这样当然不一定能满足所有的业
2014-02-18 20:48:01 684
转载 【转】自定义Hadoop数据类型
转载自:《Hadoop实战》的笔记-1、自定义Hadoop数据类型 Hadoop的自定制数据类型一般有两个办法,一种较为简单的是针对值,另外一种更为完整的是对于键和值都适应的方法: Hadoop的自定制数据类型 一般有两个办法,一种较为简单的是针对值,另外一种更为完整的是对于键和值都适应的方法: 1、实现Writable接口: /* DataInput and DataOutput
2014-02-18 20:31:32 661
原创 Hadoop伪分布式配置及与Eclipse集成开发需要注意的问题
我用的Hadoop版本是1.1.2,系统为Ubuntu 12.04 Hadoop伪分布式配置: 1、首先要修改Hadoop配置文档conf/hadoop-env.sh中JDK的路径,在第9行; 2、配置conf文件下mapred-site.xml core-site.xml hdfs-site.xml三个文件; 3、ssh无密码登陆,网上方法很多; 4、测试 $ bin/hadoop
2014-02-18 17:17:01 927
转载 【转载】Java并发性和多线程介绍
转载地址:http://ifeve.com/java-concurrency-thread-directory/ 原文地址 译文地址 Java并发性和多线程介绍多线程的优点多线程的代价如何创建并运行java线程竞态条件与临界区线程安全与共享资源线程安全及不可变性JAVA同步块线程通信死锁避免死锁饥饿和公平嵌套管程锁死Slipped ConditionsJava中的锁Java中的
2014-02-17 21:40:32 559
CRF++ toolkit 0.58
2014-10-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人