java lda中文话题_LDA_java ,LDA(Latent Dirichlet Allocation)源代码,可以实现分词、去除停用词功能。 Develop 252万源代码下载- www.pu...

这是一个Java实现的LDA(Latent Dirichlet Allocation)源代码,具备分词和去除停用词的功能。适用于文本挖掘和主题提取,包括ICTCLAS分词库和LDA模型的实现。
摘要由CSDN通过智能技术生成

文件名称: LDA_java891ea1e7dab975064c6bfd22796603ae.gif下载  收藏√  [443d104427974206832dc4b12407db70.gif

 5  4  3  2  1 fb9128a58cbeaabbeb3718ed75079ccf.gif]

开发工具: Java

文件大小: 4818 KB

上传时间: 2014-09-27

下载次数: 19

提 供 者: 河马

详细说明:Java,LDA(Latent Dirichlet Allocation)源代码,可以实现分词、去除停用词功能。-Java, LDA (Latent Dirichlet Allocation) source code, can achieve the segmentation, removing stop words function.

文件列表(点击判断是否您需要的文件,如果是垃圾请在下面评价投诉):

LDA_java

........\.classpath

........\.mymetadata

........\.project

........\.settings

........\.........\.jsdtscope

........\.........\org.eclipse.core.resources.prefs

........\.........\org.eclipse.jdt.core.prefs

........\.........\org.eclipse.wst.jsdt.ui.superType.container

........\.........\org.eclipse.wst.jsdt.ui.superType.name

........\Configure.xml

........\Data

........\....\BiWord.big

........\....\CoreDict.pdat

........\....\CoreDict.pos

........\....\CoreDict.unig

........\....\FieldDict.pdat

........\....\FieldDict.pos

........\....\GranDict.pdat

........\....\GranDict.pos

........\....\ICTCLAS30.ctx

........\....\ICTCLAS_First.map

........\....\ICTPOS.map

........\....\PKU.map

........\....\PKU_First.map

........\....\UserDict.map

........\....\UserDict.pdat

........\....\UserDict.pos

........\....\character.idx

........\....\character.type

........\....\nr.ctx

........\....\nr.fsa

........\....\nr.role

........\ICTCLAS.log

........\ICTCLAS50.dll

........\ICTCLAS50.h

........\ICTCLAS50.lib

........\ICTCLAS_I3S_AC_ICTCLAS50.h

........\WebRoot

........\.......\META-INF

........\.......\........\MANIFEST.MF

........\.......\WEB-INF

........\.......\.......\classes

........\.......\.......\.......\ICTCLAS

........\.......\.......\.......\.......\I3S

........\.......\.......\.......\.......\...\AC

........\.......\.......\.......\.......\...\..\ICTCLAS50.class

........\.......\.......\.......\TestMain.class

........\.......\.......\.......\com

........\.......\.......\.......\...\xh

........\.......\.......\.......\...\..\analyzer

........\.......\.......\.......\...\..\........\ICTCLASAnalyzer.class

........\.......\.......\.......\...\..\........\ICTCLASTokenizer.class

........\.......\.......\lib

........\.......\.......\web.xml

........\.......\index.jsp

........\lucene-core-3.6.1.jar

........\src

........\...\ICTCLAS

........\...\.......\I3S

........\...\.......\...\AC

........\...\.......\...\..\ICTCLAS50.java

........\...\TestMain.java

........\...\com

........\...\...\xh

........\...\...\..\analyzer

........\...\...\..\........\ICTCLASAnalyzer.java

........\...\...\..\........\ICTCLASTokenizer.java

........\text.txt

........\user.lic

........\userdict.txt

输入关键字,在本站252万海量源码库中尽情搜索:

帮助

[2012.10.16.rar] - 微博的工作日志写的关于《基于MB-lda》模型的微博主题挖掘,了解了LDA是一种文本生产模型,采用概率产生式对文本进行建模,而微博生成模型MB-LDA是对于LDA的基础上增加了对微博的联系人关系和文本关联进行统一建模形成适合微博主题挖掘的模型

[lda-j-src-20050325.zip] - lda (latent dirichlet allocation) 的java实现

[lda.rar] - 基于lda的主题提取,从txt类型的源码中提取出整篇文档的关键字(主题)

[lda-java-src.rar] - lda主题模型代码,希望对文档主题分析感兴趣的人有所帮助~~~~~

[Latent-Dirichlet-Allocation.rar] - 关于文本的主题提取——lda(隐狄利克雷分布)算法开山论文。

[fencizf.rar] - 基于java编程,采用最大匹配算法实现简单的中文分词,并过滤停用词

[ExcludeStopWord.rar] - 对一段中文文本经中文分词后,根据停用词表,去除文档中的停用词。

[javalda.rar] - java lda, 计算Lda参数,用EM算法

[lda.rar] - 聚类,把文件库聚类,得到所需的资料,lda模型的代码

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值