自然语言处理
文章平均质量分 94
Cins侯卓
我的征途是星辰大海。
展开
-
斯坦福大学自然语言处理第二课“文本处理基础(Basic Text Processing)”
文本处理基础1.正则表达式(Regular Expressions)正则表达式是重要的文本预处理工具。 以下截取了部分正则写法: 2.分词(Word tokenization) 我们在进行每一次文本处理时都要对文本进行统一标准化(text normalization)处理。文本规模 How many words? 我们引入变量Type和Token 分别代表词典中的元素(an原创 2015-08-26 18:47:21 · 2628 阅读 · 0 评论 -
Stanford机器学习课程(Andrew Ng) Week 1 Model and Cost Function --- 第一节 Model representation
Model representation 课程地址: https://www.coursera.org/learn/machine-learning/lecture/db3jS/model-representation?sort=lastActivityAtDesc&page=1这节课将通过讲述一个完整的线性回归的例子来了解监督学习的完整流程。首先根据不同房屋尺寸所出售的价格画出数据集,原创 2015-12-14 11:41:12 · 1562 阅读 · 0 评论 -
斯坦福大学自然语言处理第七课“情感分析(Sentiment Analysis)”
课程地址:https://class.coursera.org/nlp/lecture/311. What is Sentiment Analysis?情感分析(Sentiment analysis)又可以叫做 意见抽取(Opinion extraction) 意见挖掘(Opinion mining) 情感挖掘(Sentiment mining) 主观分析(Subjectivity anal原创 2015-12-02 21:25:20 · 15469 阅读 · 2 评论 -
机器学习笔记(三)矩阵和线性代数
特征向量、对称矩阵对角化、线性方程原创 2016-03-09 17:00:37 · 4527 阅读 · 0 评论 -
LDA(一):LDA前身PLSA介绍与推导
PLSA介绍与推导:概率隐语义分析(PLSA)是一个著名的针对文本建模的模型,是一个生成模型。因为加入了主题模型,所以可以很大程度上改善多词一义和一词多义的问题。数学基础:生成模型: 预测模型的公式是P(y|x)P(y|x),即给定输入,输出给定输入的概率分布,就要学习联合分布P(x,y)P(x,y),所以还要先求出P(x)P(x),反应的数据本身的相似度。 这样的方法之所以称为生成方法,是因原创 2016-05-21 13:36:21 · 4542 阅读 · 1 评论