自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 《数学之美》读书笔记3

重要的数学模型1.隐含马尔可夫模型 马尔可夫假设:随机过程中各个状态St的概率分布只与它的前一个状态St-1有关。 符合这个假设的随机过程称为马尔可夫过程,也称为马尔可夫链。 隐含马尔可夫模型是上述马尔可夫链的一个扩展:任一时刻t的状态St是不可见的。但是,隐含马尔可夫模型在每个时刻t会输出一个符号Ot,而且Ot跟St有关,且仅与St有关,这个被称为独立输出假设。 隐含马尔可夫模型的结构如下

2016-08-28 16:15:13 702

原创 《数学之美》读书笔记2

关于文本分类,以新闻分类为例。可以利用上一篇中提到的用于计算网页和查询相关性的TF-IDF来构造特征向量,对于一篇新闻中的所有实词,计算出它们的TF-IDF来构造特征向量。对于一篇新闻中的所有实词,计算出它们的TF-IDF值,把这些值按照对应的实词在词汇表中的位置依次排序,就得到一个向量,用这个向量来代表这篇新闻。用余弦定理来计算两篇新闻之间的相似度,余弦值越小表示两篇新闻越相似。分类方法: 1.

2016-08-28 14:44:11 626

原创 《数学之美》读书笔记1

关于搜索引擎 1.自动下载互联网的所有网页——网络爬虫 先介绍两个概念,广度优先搜索(Breadth-First Search,BFS)和深度优先搜索(Depth-First Search,DFS)。BFS是指尽可能“广”地访问与每个节点直接相连的其他节点,DFS是一条路走到黑。 搜索引擎的网络爬虫更应该定义成“如何在有限的时间里最多地爬下最重要的网页”。在各个网站中最重要的网页肯定是首页,所

2016-08-27 20:39:45 817

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除