文件名称: LDA_java下载 收藏√ [
5 4 3 2 1 ]
开发工具: Java
文件大小: 4818 KB
上传时间: 2014-09-27
下载次数: 19
提 供 者: 河马
详细说明:Java,LDA(Latent Dirichlet Allocation)源代码,可以实现分词、去除停用词功能。-Java, LDA (Latent Dirichlet Allocation) source code, can achieve the segmentation, removing stop words function.
文件列表(点击判断是否您需要的文件,如果是垃圾请在下面评价投诉):
LDA_java
........\.classpath
........\.mymetadata
........\.project
........\.settings
........\.........\.jsdtscope
........\.........\org.eclipse.core.resources.prefs
........\.........\org.eclipse.jdt.core.prefs
........\.........\org.eclipse.wst.jsdt.ui.superType.container
........\.........\org.eclipse.wst.jsdt.ui.superType.name
........\Configure.xml
........\Data
........\....\BiWord.big
........\....\CoreDict.pdat
........\....\CoreDict.pos
........\....\CoreDict.unig
........\....\FieldDict.pdat
........\....\FieldDict.pos
........\....\GranDict.pdat
........\....\GranDict.pos
........\....\ICTCLAS30.ctx
........\....\ICTCLAS_First.map
........\....\ICTPOS.map
........\....\PKU.map
........\....\PKU_First.map
........\....\UserDict.map
........\....\UserDict.pdat
........\....\UserDict.pos
........\....\character.idx
........\....\character.type
........\....\nr.ctx
........\....\nr.fsa
........\....\nr.role
........\ICTCLAS.log
........\ICTCLAS50.dll
........\ICTCLAS50.h
........\ICTCLAS50.lib
........\ICTCLAS_I3S_AC_ICTCLAS50.h
........\WebRoot
........\.......\META-INF
........\.......\........\MANIFEST.MF
........\.......\WEB-INF
........\.......\.......\classes
........\.......\.......\.......\ICTCLAS
........\.......\.......\.......\.......\I3S
........\.......\.......\.......\.......\...\AC
........\.......\.......\.......\.......\...\..\ICTCLAS50.class
........\.......\.......\.......\TestMain.class
........\.......\.......\.......\com
........\.......\.......\.......\...\xh
........\.......\.......\.......\...\..\analyzer
........\.......\.......\.......\...\..\........\ICTCLASAnalyzer.class
........\.......\.......\.......\...\..\........\ICTCLASTokenizer.class
........\.......\.......\lib
........\.......\.......\web.xml
........\.......\index.jsp
........\lucene-core-3.6.1.jar
........\src
........\...\ICTCLAS
........\...\.......\I3S
........\...\.......\...\AC
........\...\.......\...\..\ICTCLAS50.java
........\...\TestMain.java
........\...\com
........\...\...\xh
........\...\...\..\analyzer
........\...\...\..\........\ICTCLASAnalyzer.java
........\...\...\..\........\ICTCLASTokenizer.java
........\text.txt
........\user.lic
........\userdict.txt
输入关键字,在本站252万海量源码库中尽情搜索:
帮助
[2012.10.16.rar] - 微博的工作日志写的关于《基于MB-lda》模型的微博主题挖掘,了解了LDA是一种文本生产模型,采用概率产生式对文本进行建模,而微博生成模型MB-LDA是对于LDA的基础上增加了对微博的联系人关系和文本关联进行统一建模形成适合微博主题挖掘的模型
[lda-j-src-20050325.zip] - lda (latent dirichlet allocation) 的java实现
[lda.rar] - 基于lda的主题提取,从txt类型的源码中提取出整篇文档的关键字(主题)
[lda-java-src.rar] - lda主题模型代码,希望对文档主题分析感兴趣的人有所帮助~~~~~
[Latent-Dirichlet-Allocation.rar] - 关于文本的主题提取——lda(隐狄利克雷分布)算法开山论文。
[fencizf.rar] - 基于java编程,采用最大匹配算法实现简单的中文分词,并过滤停用词
[ExcludeStopWord.rar] - 对一段中文文本经中文分词后,根据停用词表,去除文档中的停用词。
[javalda.rar] - java lda, 计算Lda参数,用EM算法
[lda.rar] - 聚类,把文件库聚类,得到所需的资料,lda模型的代码