![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
文章平均质量分 75
云治
这个作者很懒,什么都没留下…
展开
-
自然语言处理
下载 App 注册或登录自然语言处理自然语言处理怎么最快入门?最好是方法与教程关注问题写回答 4 广告全面屏手机 31 个回答默认排序 微软亚洲研究院微软亚洲研究院专注科研19年,盛产黑科技收录于 编辑推荐知乎圆桌 · 768 人赞同了该回答谢邀。 针对这个问题,我们邀请了微软亚洲研究院首席研究员周明博士为大家解答。 周明博士于2016年12月当选为全球计算语言学和自然语言处理研究领域最具转载 2018-04-08 20:48:40 · 1935 阅读 · 0 评论 -
数据挖掘研究方向、热点以及对大数据研究的认识
通过上网查询以及看同行对会议的公共认识,数据挖掘领域的顶级会议是KDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining),公认的、排名前几位的会议是KDD、ICDE、CIKM、IC转载 2018-04-08 20:49:41 · 7858 阅读 · 1 评论 -
PCA算法分析
这个是在研一的概率论课上做的实验报告,PCA算法分析,对降维进行了一定程度的了解,并用PCA实现降维,具体语言是Python。第一章 概率论与随机过程在降维中的应用——PCA算法分析1.1 PCA背景1.1.1降维的意义在大数据集上进行复杂的分析和挖掘需要很长的时间,数据降维产生更小但保持数据完整性的新数据集,在降维后的数据集上进行分析和挖掘将更有效率数据降维的意义:1)降...原创 2018-08-04 11:02:48 · 1124 阅读 · 0 评论 -
朴素贝叶斯
这也是在概率论课上做的实验报告,因为整理成文档比较麻烦,就直接上PPT了。朴素贝叶斯适用于分类任务,思想简单,用统计的结果充当先验概率,并以此来估计后验概率。 #!/usr/bin/python# coding=utf-8from numpy import *# 过滤网站的恶意留言 侮辱性:1 非侮辱性:0# 创建一个实验样本def loadData...原创 2018-08-04 11:13:24 · 490 阅读 · 2 评论 -
隐马尔可夫模型
这是从刚接触自然语言处理就开始学习的算法之一,隐马可以用与词性标注和分词,在我上概率论课的时候我将其进行总结:2.1 隐马尔可夫模型2.1.1马尔可夫链定义:马尔可夫链是指数学中具有马尔可夫性质的离散事件随机过程,在给定当前信息的情况下,过去对预测将来是无关的。每个状态的转移只依赖与之前的n个状态,其中n是影响状态转移的数目,最简单的马尔可夫过程就是一阶过程,每一个状态的转移只依赖于之...原创 2018-08-07 10:08:13 · 377 阅读 · 0 评论 -
EM算法
em算法比较基础,在自然语言处理过程中,除了聚类,在机器翻译的词对齐中,也用到了相关的概念。 在我概率论课上 对于em的思想进行了总结,就不弄成word了,直接上我的PPT ,最后也对简单的实验进行了实现。这里还有当时手写版的公式推导, (推导过程并不困难,主要是理解其巧妙的思想)例子在很多博客中都有,我选用了比较简单的抛硬币的例子来分析emPPT如果写的不...原创 2018-08-13 13:56:02 · 357 阅读 · 0 评论 -
自然语言处理 词向量
为把人们所理解的自然语言 让 计算机也能够 认识并且操作,需要将人的语言(即文字)转换成计算机的语言(即数字)我们将其称为词向量。把文字转换成词向量有多种编码方式:大致分为两类,离散表示和分布式表示。离散表示即 无法衡量词与词之间的关系,即在编码过程中并不考虑词的顺序,以此为代表的编码方式包括: one-hot ...原创 2018-08-13 14:34:30 · 1607 阅读 · 0 评论