自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

翻译 卷积神经网络入门

卷积神经网络(Convolutional neural networks)。听起来就像是生物加数学在再计算机科学为佐料做成的一个狂野的组合,但这些网络却是计算机视觉领域极富有影响力的一部分创新。2012年是神经网络大放异彩的第一年,因为Alex Krizhevsky在2010年的ImageNet竞赛

2017-11-22 13:02:27 316

原创 K-Means 文本聚类

信息内容安全的一个作业, 要求用K-means聚类算法对一定量的新闻文本进行分类。为便于总结,同时交作业,以此记之。

2017-04-18 12:27:48 1679

原创 贝叶斯推断应用:垃圾邮件过滤

附上新博客地址:月光森林引入仍然是“信息内容安全” 课程的一个实验总结。为了理解整个原理,不但重新复习了一边贝叶斯,还因为对“联合概率”理解不透彻,直接翻译了一篇文章 —— 联合概率(翻译)。特此对整个实验进行总结。准备50封邮件,25封垃圾邮件和25封正常邮件操作系统: ubuntu 16.04python版本: 3.5.2参考 : 贝叶斯推断及互联网应用(一...

2017-04-06 18:47:25 2297 3

翻译 联合概率(翻译)

现在有两个预言家 Mr.Smith 和 Mr.Jone。对于一个事件 X ,现在给出这两个预言家的预言 :Mr.Smith 预言它 不会发生,并且他预测正确的概率是 75%, 那么在他预言的基础上 X 事件 会发生的概率就是 0.25。

2017-03-31 20:51:39 501

原创 使用python做tf-idf算法实践

引入信息内容安全课杨老师讲了一个tf-idf算法,用于提取一篇文档的关键词。觉得蛮好玩又正好练习python,所以就试着写了一下,特此记录,各位看官请轻拍板砖。tf-idf 算法及其原理偷个懒,直接贴维基百科的解释:至于原理,同样贴图(没错,我就这么懒了怎么样吧。。→_→) :如果看维基还是了解不清楚的话,推荐阮一峰大神的博客,这个也是我们的老师上课讲的东西。至于其中的数学原理,从维基的原理就很容易

2017-03-27 19:49:50 2077 1

原创 组合数学例题:Codeforces#round404 - D(785D)

codeforces#Round404-D 题解

2017-03-17 17:19:04 534

原创 第一个爬虫:爬取古诗中带有“月”字的诗句

引言为了练习python,所以到处找资料试着写了一个自己的爬虫。因为是第一个爬虫,所以比较简单,不超过50行。主要源于爬取的网站没有什么限制而且网页排布很规律,也就没有什么技术亮点,单纯的入门爬虫而已。爬取目标及准备python版本:3.4.3爬取对象: 古诗文网(so.gushiwen.org)随便点开一个古诗文网的诗歌页面,观察它的URL地址就会发现,诗歌的地址基本由 “so.gushiwen

2017-02-21 10:54:23 2486 1

原创 卢卡斯(Lucas)定理

引入之前有写过一篇博客是求组合数(取模)的两种方法。那篇文章里介绍的方法其实也还有局限性,Pascal打表由于内存的限制一般只用于求取1000以内的组合数,而使用逆元套公式的方法其实也只适用于求取的组合数 C(n,m)%pC(n, m) \% p 中,n 和 m均不大于要求的模数 p 。这样就导致了一个很尴尬的问题——如果要求取的组合数超过了模数p,这个时候有要怎么办呢。本人之前由于水平限制并没有

2016-11-07 11:24:05 7087 3

原创 求组合数(取模)的两种方法

概述首先我们要知道什么是组合数。具体可以参考我之前的博客 “排列与组合”笔记 中,集合的组合的部分。这里复述如下: 令r为非负整数。我们把n个元素的集合S的r-组合理解为从S的n个元素中对r个元素的无序选择。换句话说,S的一个r-组合是S的一个子集,该子集由S的n个元素中的r个组成,即S的一个r-元素子集。由此,求解组合数即变成了求式子C(n, r) 的值。法一:Pascal公式打表由Pascal公

2016-09-22 23:20:23 10612 8

原创 矩阵快速幂在常系数线性递推关系中的应用

先引入一下,知乎上有一个问题 关于斐波拉契数列的一个低级问题 。题主询问了关于求解斐波拉契数列第n项对10007取模的结果。而这个n,可以达到10610^6甚至10910^9 。解法已经在排名第一的回答中给出了,主要思路就是快速幂和矩阵乘法的结合律,亦即矩阵快速幂。具体方法这里也就不再给出。但可以依托此思想,拓展出在O(logn)O(logn) 的时间下计算一个递推关系的第n项。另外要说明

2016-09-09 00:34:17 1962

原创 组合数学笔记之四——“递推关系和生成函数”

简单数列举例及应用令h1,h2,h3,⋯,hn,⋯h_1, h_2, h_3, \cdots, h_n , \cdots 表示一个数列,hnh_n 叫做序列的一般项或生成项。算数数列每一项都比前一项大一个常数qq 。 若给定初始项h0h_0 和常数 qq 则序列唯一确定 : h0,h0+q,h0+2q,⋯,h0+nq,⋯h_0, h_0 + q , h_0 + 2q, \cdots

2016-09-07 16:10:31 2163

原创 “容斥原理及其应用”笔记

容斥原理举例对{1, 2, … , n}的排列i1, i2, … , in计数,其中1不在第1个位置上(即i1 ≠ 1)已知1在第一个位置上的排列数和{2, 3, … , n}的排列数(n−1)!(n - 1) ! 相同,而{1, 2, … , n}的排列总数为n!n!。因此 1 不在第一个位置的{1, 2, … , n} 排列个数有(n−1)!(n−1)(n - 1)!(n - 1

2016-08-30 23:43:29 3148

原创 treap(树堆)

回顾: 二叉搜索树的定义与操作二叉搜索树是指一颗空树或具有下列性质的树:任意节点的左子树不空,则左子树上所有结点的值均小于它的根结点的值;任意节点的右子树不空,则右子树上所有结点的值均大于它的根结点的值;任意节点的左、右子树也分别为二叉查找树;没有键值相等的节点——from<维基百科>二叉搜索树的操作包括:查找, 插入, 删除;查找小于X的元素个数/查找第k大的元素treap的定义t

2016-08-28 14:33:58 1311

原创 组合数学笔记之二——“二项式系数”

二项式系数8/10/2016 5:55:10 PM by 林维1. Pascal公式对于满足1 ≤ k ≤ n - 1的所有整数 k 和 n,都有C(n, k) = C(n - 1, k - 1) + C(n - 1, k).pascal三角形 : n\k 0 1 2 3 4 5 6 7 8 … 0 1

2016-08-28 00:36:04 2754

原创 “排列与组合”笔记

排列与组合8/9/2016 9:00:48 PM by 林维排列与组合基本计数原理加法原理乘法原理减法原理除法原理集合的排列集合的组合多重集的排列多重集的组合1. 基本计数原理设集合S的 一个划分 即为S的子集的集合S1, S2, … ,Sm,使得S的每一个元素恰好是这些子集之一的元素:S = S1 ∪ S2 ∪ … ∪ SmSi ∩ Sj = ∅ (i ≠ j)子集S1

2016-08-20 00:50:14 923

原创 字符串算法总结

KMP算法参考: http://www.matrix67.com/blog/archives/115 && 具宗万《算法问题实战策略》1.1 任务 字符串检索问题。确认给定的“草堆”(haystack)字符串 H 中是否包含“缝衣针”(needle)子字符串 N ,如果包含,则找出子字符串N的起始位置。KMP算法的任务就是实现一种能够在线性复杂度内求出一个串在另个一串的所在匹配位置。1.2 说

2016-08-17 22:12:27 296

提示
确定要删除当前文章?
取消 删除