HanLP实现文本分词、提取关键词、聚类(工具资源+实例)
HanLP是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点;提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。
DBeaver.rar
两个版本的数据库连接工具DBeaver,包括64.32位不同版本。另附必须用的两个jar包,全套打包
内涵以下文件:DBeaver_v5.0.2;DBeaverEnterprsejhb.rar;orai18n.jar;xdb6.jar
java通过括特征选取、特征降维、分类模型学习三个步骤完成自动智能分类
THUCTC(THU Chinese Text Classification)是由清华大学自然语言处理实验室推出的中文文本分类工具包,能够自动高效地实现用户自定义的文本分类语料的训练、评测、分类功能。文本分类通常包括特征选取、特征降维、分类模型学习三个步骤。如何选取合适的文本特征并进行降维,是中文文本分类的挑战性问题。我组根据多年在中文文本分类的研究经验,在THUCTC中选取二字串bigram作为特征单元,特征降维方法为Chi-square,权重计算方法为tfidf,分类模型使用的是LibSVM或LibLinear。THUCTC对于开放领域的长文本具有良好的普适性,不依赖于任何中文分词工具的性能,具有准确率高、测试速度快的优点。
开源协议:
THUCTC面向国内外大学、研究所、企业以及个人研究者免费开放源。
如有机构或个人拟将THUCTC用于商业目的,请发邮件至thunlp@gmail.com洽谈技术许可协议。
欢迎对该工具包的任何宝贵意见和建议,请发邮件至thunlp@gmail.com。
如果您在THUCTC基础上发表论文或取得科研成果,请您在发表论文和申报成果时声明“使用了清华大学THUCTC”,并按如下格式引用:
Java中通过HanLP实现文本分词、提取关键词、聚类(工具资源+实例)
HanLP是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点;提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。
汽车销售系统源码分享
基于SSM框架的汽车销售系统,数据库使用的mysql。纯手写,适合新人学习ssm框架时参考。
欢迎大家参考指正
基于SSM框架的供应链管理系统设计与实现
注意:附件中仅提供文档,如需代码请留言邮箱,谢谢!
基于SSM框架的供应链管理系统设计与实现
摘 要
随着近年来科学技术的快速发展和使用计算机来进行工作的人群也越来越多,每一个行业的管理以及办公与计算机软件的联系变的越来越密切。而本次研发的“供应链管理系统”就是以帮助公司更加轻易的进行管理。供应链管理系统可以把公司日常工作中许多机械性的操作变的简洁明了,可以高效处理一些过程复杂而且数量也比较庞大的工作。不仅如此,使用供应链管理系统可以让企业根据对系统中的各种数据的控制从而实现了对企业工作流程的控制,让企业在同行中具有更高的竞争力。
本文详尽的介绍了基于SSM的供应链管理系统设计和实现的过程,把软件的设计分成了三个步骤:第一步需求分析,第二步是系统设计与实现以及最后一步是对系统进行测试。本系统基于SSM框架和MySQL数据库来研发一个可以对企业进销存进行管理的系统。最终实现对企业整个供应链的管理,另外本系统还可以根据企业每年的销售和采购数据自动生成年度趋势图,以便对企业的生产和销售进行直观合理的分析。
关键词: SSM;jQuery;MySQL;Ajax;
mybatis环境的搭建
适合刚接触mybatis的新人,主要教导如何将mybatis导入到项目中