NLP
海棠花开
主要记录和分享学习内容。
展开
-
NLP——Kmeans聚类算法简单实现
Kmeans聚类算法说明(百度百科)本例中主要是对二维点进行距离计算,开始得时候选取两个心,最终聚为两簇。结束条件的判断有很多种,这里采用的是最简单的:当两个心不再变化了,则停止聚类。内部距离和可以不需要计算,这里输出来做结果评估用。public class Km_w2 { //初始化二维数据/* public static double[] x = {1, 2, 1, -1, -...原创 2018-10-08 18:32:08 · 896 阅读 · 0 评论 -
NLP——斯坦福分词工具简单使用
本例主要演示斯坦福的中文分词工具包stanford-segmenter.jar下载地址解压后如下:创建好项目将data文件夹导入到项目根目录下导入jar包SegDemo.java文件则是演示文件注意事项SegDemo执行的时候要读取data中的内容查阅源代码发现,最后返回的分词集合segmented是数组转换成的(Arrays.asList()),不可进行修改。所以需要用li...原创 2018-10-08 21:06:38 · 5174 阅读 · 0 评论