搜狗拼音细胞词库的特殊用法--语料库,中文NLP

原创 2007年11月17日 18:25:00
搜狗的输入法,它推出了细胞词库--都是网友整理的,每个词库都是一个小小的领域,我就下了魔兽世界的。http://pinyin.sogou.com/dict/ 做毕业设计时,我的语料库就需要这些词汇,当初很愁没人帮忙,现在好了,嘿嘿~~Sogou的爱好者殊不知自己也在为中文NLP做贡献。虽然没有词频是个缺陷。。。。。 不管怎么说,做语料库,词库有着落了。 感谢搜狗!感谢支持搜狗拼音的Fans! 词库分类目录(2007.11.17 18:17) 游戏(159): 网游 单机 桌面 手机 其他 >>更多 专业(368): 理工类 农医类 社科类 军事类 教育类 其他 >>更多 地区(262): 北京 上海 天津 重庆 安徽 澳门 福建 甘肃 广东 广西 >>更多 娱乐(91): 音乐 电影 电视 其他 >>更多 生活爱好(83): 理财 汽车 饮食 宠物 动漫 房产 旅游 其他 >>更多 体育运动(53): 足球 篮球 健身 田径 其他 >>更多 文化艺术(160): 文学 艺术 历史 哲学 宗教 语言 考古 读书 其他 >>更多 个人专用(757): 人名类 其他 >>更多

将搜狗细胞词库转换为其他输入法词库——深蓝词库转换1.1发布

以前在搜狗拼音输入法和QQ拼音输入法之间纠结,手机上用的又是百度手机输入法(也就是之前的点讯梅花输入法),在不断纠结的过程中,所以写了一个小工具,实现了各个输入法之间的词库互转,具体参见:http:/...
  • studyzy
  • studyzy
  • 2013年09月10日 14:22
  • 1290

QQ拼音输入法词库和搜狗输入法词库[相互导入](使用Excel公式)

最近QQ拼音输入法和搜狗输入法闹得很凶,HzlzH不做评价,仅仅提供相互转换的方法。           为什么要导入导出呢?      1、搜狗和QQ拼音词库的 格式 不完全一样!不能直接...
  • wolfsina
  • wolfsina
  • 2013年02月02日 22:36
  • 3326

一些文本语料库

一、语料库链接 下面提供一些网上能下载到的中文的好语料,供研究人员学习使用。 (1).中科院自动化所的中英文新闻语料库 http://www.datatang.com/data/1...
  • a18852867035
  • a18852867035
  • 2016年07月24日 17:06
  • 3486

文本分类中语料库的获取——对搜狗语料库进行想要格式的获取

最近一个都在整数据挖掘课程的大作业,终于告一段落,也有时间来更新一些博客。第一次接触文本分类,一个月内学到了太多,期间涉及到的一些处理上的主要部分需要总结一下,以便之后查阅。 这次主要总结搜过语料库...
  • sgfmby1994
  • sgfmby1994
  • 2016年12月02日 17:15
  • 3972

java解析搜狗词库scel文件到txt

SougouScelReader 读取词库文件类 import java.io.*; import java.net.URL; import java.util.ArrayList; import ...
  • AVGworkld
  • AVGworkld
  • 2016年11月03日 11:49
  • 1668

Solr之——整合mmseg4j中文分词库

在上一篇博文《Solr之——整合Tomcat》中,我们介绍了Solr与Tomcat的整合方式,还没有阅读上一篇博文的朋友,请先阅读上一篇博文《Solr之——整合Tomcat》,本文是在上一篇博文的基础...
  • l1028386804
  • l1028386804
  • 2015年11月19日 22:07
  • 1967

Xposed框架开发入门(三)--Android某输入法用户个人词库提取

前面已经介绍了Xposed框架开发的基本原理与简单的使用方法(具体可以参考:Xposed框架开发入门(一)和Xposed框架入门开发(二)–使用Xposed框架实现Activity跳转拦截),同时在第...
  • qq_24280381
  • qq_24280381
  • 2017年04月16日 18:49
  • 1368

文本挖掘—搜狗语料库数据预处理

package muyanmoyang.text_classify.Classify; import java.io.BufferedReader; import java.io.File; impo...
  • muyanmoyang
  • muyanmoyang
  • 2015年05月10日 14:15
  • 1802

linux下搜狗输入法不能输入中文的解决方案

linux 下搜狗输入法不能输入中文的解决方案 CSDN GitHub linux 下搜狗输入法不能输入中文的解决方案 AderXCoding/system/tools/you-get ...
  • gatieme
  • gatieme
  • 2017年04月01日 21:20
  • 5178

自然语言处理NLP工具包

1. Java自然语言处理 LingPipe LingPipe是一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、...
  • u012335419
  • u012335419
  • 2015年06月30日 15:49
  • 1457
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:搜狗拼音细胞词库的特殊用法--语料库,中文NLP
举报原因:
原因补充:

(最多只允许输入30个字)