![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
文本分类
梅逊雪
1.研究与语音相关的处理和算法:包括语音识别、增强、变调、去噪,分类,打标,etc.,
音频的相关处理:基于机器学习,深度学习的音频分类,音频检索,音频数据挖掘,etc.。
2.研究自然语言处理,语音文字转写,文本处理(过滤,聚类,分类,检索,TDT(话题检索与跟踪)关键词提取),etc.。
展开
-
最近关注学习文本分类——天书般的ICTCLAS分词系统代码(一)
中科院的ICTCLAS 分词系统ICTCLAS分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,该版的Free版开放了源代码,为初学者提供了宝贵的学习材料。我们可以在“http://sewm.pku.edu.cn/QA/”找到FreeICTCLASLinux.tar的C++代码。可是目前该版本的ICTCLAS并没有提供完善的文档,所以阅读起来有一转载 2017-08-24 11:30:56 · 243 阅读 · 0 评论 -
文本特征提取方法研究
一、课题背景概述文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同。文本挖掘的对象是海量、异构、分布的文档(web);文档内容是人类所使用的自然语言,缺乏计算机可理解的语义。传统数据挖掘所处理的数据是结转载 2017-10-17 17:36:35 · 13077 阅读 · 0 评论 -
2018年实现的工程项目
研究场景化智能坐席相关的语音处理,开发相关项目:未接通电话分类:分了8类,准确率95%+ (机器学习) 常用货币的分类,包含各种方言说的货币类型,自动识别为所对应的标签。(机器学习) 语音增强&语音增益处理 (深度学习) 语音分离 & 说话人的分离 语音时序分割,及所属说话人打标签 (机器学习) 静音检测标记、语速检测标记、情感识别标签 预研了TTS-文字转语音...原创 2019-01-15 14:42:13 · 142 阅读 · 0 评论