自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 关于被3个搞物理的“颠覆”了且数学天才陶哲轩“开始压根不相信”的数学常识的算法实现与理解

近日,网上公布了一篇关于根据子矩阵的特征值求得平方赋范特征向量的一篇文章“Eigenvectors from Eigenvalues”[1]。据网上推文描述,该文章是三位物理学家Peter Denton、Stephen Parke和张西宁在做中微子研究时意外发现的一项成果。该推文名为《3个搞物理的...

2019-11-16 19:05:02

阅读数 705

评论数 1

原创 基于距离积分的交通轨迹聚类算法

为了做好城市规划和交通管理工作,对车辆运动轨迹的分析和研究是必不可少的一项工作。然而,现实中每时每刻都有成千上万的车辆在城市中,短时间内的车辆轨迹采集即可形成大量数据。数据的极度庞大和错综复杂使得人们难以直接通过所采集的轨迹数据获取任何有效信息。而对交通轨迹数据的聚类则可以有效地将数据约简,并从中...

2017-12-31 17:00:37

阅读数 4305

评论数 2

原创 数据库管理工具V1.0

概述 在项目初始阶段,数据库搭建是一件非常重要的工作。然而,常见的数据库管理工具往往都不太友好,自动化程度不够高。对于公司的项目来说,一种较为规范的做法是在每次建立一个数据库表格之前,都需要写明一个与该表格相对应的表格文档用来说明该数据表的具体内容。然后,再由某个人根据文档的内容转化成SQ...

2016-07-25 00:23:32

阅读数 627

评论数 0

原创 马尔科夫的词性分析三部曲

在自然语言处理(NLP)领域,单词除了其本身的含义可以用来传递信息外,单词的词性属性也包含也包含了非常重要的信息。根据单词的词性,人们可以对文本的单词进行过滤筛选,以筛选掉那些信息含量较少的单词,从而提升处理的文本质量。而如何从文本中有效地甄别每个单词的词性并非是一个简单的问题,原因在于中文单词很...

2016-07-08 20:08:12

阅读数 2274

评论数 0

原创 差分隐私若干基本知识点介绍(二)

在数周前所发表的博文《差分隐私若干基本知识点介绍(一)》中,介绍了差分隐私中最为常见的拉普拉斯机制以及其与差分隐私之间的关系,并得到了一定的认可。因此,在前文的基础上续写本文,进一步介绍一些与差分隐私相关的基础知识。主要包括拉普拉斯机制的补充内容以及差分隐私的组合原理。相比于前文,本文所介绍的知识...

2016-06-11 19:57:53

阅读数 9748

评论数 11

原创 差分隐私若干基本知识点介绍(一)

为解决当前信息越来越发达的社会所带来的用户隐私泄露问题,本人所研究的差分隐私模型是一种被广泛认可的严格的隐私保护模型。它通过对数据添加干扰噪声的方式保护所发布数据中潜在的用户隐私信息,从而达到即便攻击者已经掌握了除某一条信息以外的其他信息,该攻击者仍然无法推测出这条信息。因此,这是一种从数据源头彻...

2016-05-20 20:49:17

阅读数 20307

评论数 6

原创 谱范数的理解与论述

对于任意两点间来说,直线距离最短。而计算两点间距离的公式就是源于众所周知的勾股定理的基础上推导而来的。事实上,不仅对于人们所熟知的二维空间和三维空间如此,对于高维空间亦是如此。在数学上,一般将高维空间的点表示为一个多维向量,而任意一个点到原点的直线距离则称为该点的二范数。对于诸多的计算机或数学相关...

2016-09-25 21:06:09

阅读数 7830

评论数 0

原创 老板/员工流式并行计算模型

随着大数据时代的到来,人们越来越频繁地需要处理越来越大规模的数据。传统的单线程处理模式已经远远不能满足人们的需要,于是各种分布式计算系统如雨后春笋般不断涌现,其中包括了基于Map-Reduce并行计算的Spark,Hadoop等系统,以及Hdfs,HBase之类的基于分布式存储系统。不过这些系统固...

2016-06-25 21:15:24

阅读数 1116

评论数 0

原创 大数据下的多维TopK算法

在数周前所发表的博文《大数据下的TopK算法》中介绍了求解大数据时代中几乎是最为经典的TopK的过程。虽然大数据技术使得大规模数据下的TopK问题得到了有效的解决,但是对于一些该问题的拓展,单单靠大数据技术是无法获得令人满意的解决方案。本文所述的多维数据下的TopK问题就是这一类问题。如果该算法直...

2016-06-19 11:25:29

阅读数 1165

评论数 0

原创 基于树状数组的高效轮盘赌算法

在许多经典的遗传算法、蚁群算法的实现过程中,常常需要根据每个对象的生存能力在进行优胜劣汰从而获得尽可能最优的个体。该过程人们一般采用轮盘赌算法来实现。这是一种经典的随机选择算法,在网上只要搜索相关词条就有不少关于该算法的实现。然而,这些算法实现随机选择的过程往往是先生成一个0到1之间的随机值,然后...

2016-06-03 20:19:10

阅读数 2680

评论数 0

原创 大数据下的TopK算法

在大数据背景下,TopK问题是一个很常见的问题。常见到这类问题基本在任何从事大数据相关的工作中都会用到。而我以前面试和大数据相关的岗位时也基本每次都会被问及这一问题或者这一问题的简单变种。因此,写本文详细介绍一下在大数据背景下TopK问题的解决方法,供大伙学习学习,尤其是让即将面临找工作面试的同学...

2016-05-27 20:30:57

阅读数 4275

评论数 0

原创 信息增益(互信息)非负性证明

信息增益又称互信息,它是信息论的基本概念之一。同时,它在当今流行的人工智能领域也多有涉及。其中,著名的决策树算法IC3就是以信息增益作为贪心选择的依据。         信息增益的定义如下:                                                 ...

2015-09-11 17:22:14

阅读数 7386

评论数 1

原创 编程之美1.13 威佐夫博奕拓展的分析与论证

在上一篇关于《编程之美》中所涉及的博弈论拓展的文章中,我们就尼姆博弈的两种拓展形式展开讨论,并获得了满意的结果。具体内容请详见本人所写博文《编程之美1.12 尼姆博弈拓展的分析与论证》。尼姆博弈是该文中所提到的三个博弈问题的第一个。而本文将承接上文进一步探讨下一个博弈问题的拓展——威佐夫博奕。 威...

2015-08-23 17:26:40

阅读数 701

评论数 0

原创 最小生成树(Prim算法和Kruskal算法)—理解与论证

向世界分享科学之美,让科学流行起来          对于一个给定的连通无向图G=(V,E),其最小生成树被定义如下:取边集E中的子集E‘构成连通树,同时满足,其中表示边(集)的权值。         关于最小生成树的算法,有两个非常经典的算法Prim算法和Kruska...

2015-08-23 17:16:18

阅读数 2585

评论数 0

原创 KMP中Next值和NextVal值的定义

在KMP算法中,有两个重要的步骤就是需要对模式串求解其Next数组和NextVal数组。         网络上的文章有许多关于求解这两个数组的文章。然而,绝大多数文章都是告诉你这两个数组是怎么求解的,而且这些文章由于实现的标准不同。对于同样的字符串,他们求解出的Next数组和NextVal数组往...

2015-08-20 13:18:02

阅读数 2758

评论数 0

原创 编程之美1.12 尼姆博弈拓展的分析与论证

在书籍《编程之美》中,总共讲述了三个关于取石子博弈的问题。书中对这三个博弈问题的本身都有详细的解答。然而,看懂这些解答本身并不是一件难事。我们学知识呢,应该学会举一反三,这样才算是真正掌握了知识,同时也才能真正体会到解决问题的乐趣。本文写作的目的就是从这三个问题出发,然后对一系列与之相关的拓展问题...

2015-08-18 19:41:08

阅读数 1564

评论数 0

原创 编程之美1.13 威佐夫(NIM)博奕(Wythoff Game)涉及的数学定理论证

威佐夫博奕的问题描述如下:有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。问给定两堆物品的数量,谁会赢得这个游戏。         这一问题是一个很有趣的问题,而且解法也是十分的巧妙。该题目的解法就是找出奇异局势(即先手必输)。其...

2015-08-16 10:11:12

阅读数 1232

评论数 4

原创 《编程之美》1.6 饮料供货——贪心解法证明

向世界分享科学之美,让科学流行起来 问题描述:      在微软亚洲研究院上班,大家早上来的第一件事是干啥呢?查看邮件? No, 是去水房拿饮料:酸奶,豆浆,绿茶、王老吉、咖啡、可口可乐……(当然,还是有很多同事把拿饮料当做第二件事)。管理水房的阿姨们每天都会准备很多的饮料给大家,为了提高服务...

2015-08-15 11:37:00

阅读数 1621

评论数 0

提示
确定要删除当前文章?
取消 删除