自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

翻译 LDA主题模型的渊源

在文本挖掘中,有一项重要的工作就是分析和挖掘出文本中隐含的结构信息,而不依赖任何提前标注的信息。今天我要介绍的是一个叫做 LDA(Latent Dirichlet Allocation)的模型,它在过去十年里开启了一个领域叫主题模型。从 LDA 提出后,不少学者都利用它来分析各式各样的文档数据,从新闻数据到医药文档,从考古文献到政府公文。一段时间内,LDA 成了分析文本信息的标准工具。从最原始的 LDA 发展出来的各类模型变种,则被应用到了多种数据类型上,包括图像、音频、混合信息、推荐系统、文档检索等等,

2021-04-11 21:37:54 286 1

翻译 归并排序:如何解决逆序数问题?

我们就一起来看看今天要解决的问题:给你一个任意的序列,你怎么求出序列的逆序数?首先,我们要知道什么是逆序数。在一个排列中,如果一对数的前后位置与大小顺序相反,即前面的数大于后面的数,那么它们就是一个逆序。一个排列中逆序的总数就是这个排列的逆序数。我们看下面这个序列,根据逆序数的定义,序列中逆序的个数有 5 个,分别是(7,2)、(9,2)、(7,6)、(9,6)和(14,12)。那要求序列的逆序数,一种最简单的做法就是,我们从前向后遍历序列的每个位置,每到一个位置,我们就记录一下有多少个元素大于当前

2021-02-25 19:40:53 985

翻译 堆排序:体会线性建堆法的威力

堆排序:体会线性建堆法的威力假设现在有一个水平面,上面有 8 只蚂蚁排成一排,我把这张示意图放在了文稿中。方便起见,我们给所有的蚂蚁从左到右依次编号,编号为 1 到 8。从 0 秒开始,红色蚂蚁向左爬,蓝色蚂蚁向右爬,爬行的速度都是 1m/s。如果有 2 只蚂蚁迎面碰到以后,这 2 只蚂蚁不会做任何的感情交流,而是会立刻掉头向相反方向继续爬行。而爬行到桌子边沿的蚂蚁,会从桌子上掉下去。问:有哪些蚂蚁会从左边掉下去,又有哪些蚂蚁会从右边掉下去?怎么解决蚂蚁问题?要搞定蚂蚁问题,首先你需要把自己带入到问题

2021-01-27 22:36:16 2142 3

翻译 二叉堆:动态维护集合最值的利器

二叉堆:动态维护集合最值的利器堆排序是利用堆这种数据结构完成的排序。所以,在了解堆排序之前,我们需要先了解“堆(Heap)”这种数据结构。可以说,在维护集合最值的操作上,堆是一种简单、易懂、且非常高效的数据结构。那我们先来看一个比较经典的堆问题:蚂蚁问题。假设现在有一个水平面,上面有 8 只蚂蚁排成一排。方便起见,我们给所有的蚂蚁从左到右依次编号,编号为 1 到 8。从 0 秒开始,红色蚂蚁向左爬,蓝色蚂蚁向右爬,爬行的速度都是 1m/s。如果有 2 只蚂蚁迎面碰到以后,这 2 只蚂蚁不会做任何的感情交流

2021-01-21 20:15:43 443 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除