zxhohai的博客

代码的故事,我讲给你听!

机器学习系列(八)——Logistic回归解决二分类问题

分类问题的本质是确定样本xxx属于类别cicic_i的概率p(Ci|x)p(Ci|x)p(C_i|x)。在上周整理的分类问题中,我们采用生成式方法,借助贝叶斯公式和极大似然估计,首先计算出p(x|Ci)p(x|Ci)p(x|C_i)和p(x,Ci)p(x,Ci)p(x,C_i),然后再计算出p(C...

2018-08-31 18:15:01

阅读数 1405

评论数 5

自动文摘(Automatic document summarization)方法综述(二)——基于最优化的(optimization-based)方法

在上一篇博客中,我总结了基于中心(centroid-based)的方法和基于图(graph-based)方法。这两类方法的重心都集中在给文本单元打分上,也就是判断文本单元对原始文档的覆盖度(coverage)或者说文本单元与文档主题的相关度(relevance),进而得到文本单元的重要性权重。这只...

2018-08-21 15:40:14

阅读数 670

评论数 0

机器学习系列(七)——分类问题(classification)

这一篇博客将介绍机器学习中另一个重要的任务——分类(classification),即找一个函数判断输入数据所属的类别,可以是二类别问题(是/不是),也可以是多类别问题(在多个类别中判断输入数据具体属于哪一个类别)。与回归问题(regression)相比,分类问题的输出不再是连续值,而是离散值,用...

2018-08-19 19:28:41

阅读数 10718

评论数 0

自动文摘(Automatic document summarization)方法综述(一)——基于中心的(Centroid-based)与基于图的(graph-based)方法

从Luhn1958年发表第一遍自动文摘论文开始,自动文摘(Automatic document summarization)一直是自然语言处理中最为活跃的分支。自动文摘希望通过计算机自动将冗长的文本压缩到规定长度内,同时保持原始文本主要信息不丢失。在信息爆炸的互联网时代,每时每刻互联网上都在积累更...

2018-08-12 15:07:07

阅读数 1144

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭