大数据算法
文章平均质量分 89
silent56_th
大学生一枚,对机器学习、图像处理感兴趣,偶尔也会刷刷leetcode或者hihocoder。希望在这里可以和大家多多交流,互相学习。
展开
-
大数据算法课程笔记1:寻找中值算法之随机选取,中值的中值,One Pass算法
大数据算法的课程笔记,包括四种中值搜索算法。包括最简单的先搜索后检索,平均算法复杂度为O(N)的简单随机选取算法,确定性的中值的中值算法,大概率返回中值的one pass算法。1. 最简单的方法:先排序再返回中值排序算法是O(NlogN)O(N\log N),返回中值是O(1)O(1)。整体算法复杂度是O(NlogN)O(N\log N)。2. 随机选取算法:RANDOM SELECT算法简单,并且原创 2017-10-01 21:08:52 · 3197 阅读 · 0 评论 -
大数据课程笔记3:Kolmogorov Complexity
这是大数据算法的课程笔记,这节讲的是Kolmogorov Complexity的定义以及三个性质。定义先有个图灵机的定义,然后有了一个Universal Turing Machine (UTM)的定义。假设存在输入yy和输出xx,使用一种Turing Machine TT,运行程序pp,可以从yy中生成xx,定义为x=T(p,y)x = T(p,y)。定义Kolmogorov Comlexity,基原创 2017-09-30 15:04:59 · 2036 阅读 · 0 评论 -
大数据算法作业笔记1
Problem 1Complete the proof T(n)=nloghT(n) = n\log h and find the best constant in big-OProof 1As stated in the lecture, T(n,h)≤T(n/2,h1)+T(n/2,h2)+tangent(n/2,n/2)T(n,h) \le T(n/2,h_1) + T(n/2,h_2)原创 2017-10-08 20:24:36 · 777 阅读 · 0 评论 -
大数据算法课程笔记2:2D Convex Hull
1. 题目简介Input: nn points in the plane p1,p2,⋯,pnp_1,p_2,\cdots,p_n, where pi=(xi,yi)p_i = (x_i,y_i)Output: 包含所有点的最小凸多边形的所有边2. 基本思想 :Divide and Conquer先把点集一分为二,分别求取相应凸多边形,然后对两个凸多边形合并。3. 具体算法sort P={pi}P原创 2017-10-08 20:38:22 · 718 阅读 · 0 评论 -
大数据算法课程笔记8a:page replacement algorithm
本节课主要是介绍page replacement algorithm的相关算法,包括offline和online。1. 问题简介这个是体系结构里面的经典问题,内存小、硬盘大,内存快、硬盘慢。所以CPU从内存中读取数据,而内存从硬盘中读取数据。那我们希望内存读取硬盘的次数尽量减少,这样可以减少程序的运行时间,而减少次数的算法主要依赖于page replacement algorithm。所谓page原创 2017-11-06 22:23:46 · 2286 阅读 · 0 评论 -
大数据算法课程笔记5a: fixed-parameter vertex cover
1. 问题描述一个vertex cover是一个点集的集合,并且保证图中的每一条边都存在至少一个顶点位于该点集中。具体地,G=(V,E)G=(V,E) 的一个vertex cover SS满足 S⊆V∧{∀e=(v,w)∈E,v∈S or w∈S}S\subseteq V\wedge \{\forall e = (v,w)\in E, v\in S\text{ or } w\in S\}2.原创 2017-11-06 22:31:19 · 884 阅读 · 0 评论 -
大数据课程笔记4:摘要结构,streaming algorithm
这是大数据课程第四节的笔记,笔者自己的理解使用斜体注明,正确性有待验证。This is the note of lecture 4 in Big Data Algorithm class. The use of italics indicates the author’s own understanding, whose correctness needs to be verified. 1. Sy原创 2017-10-15 15:00:33 · 1584 阅读 · 0 评论 -
[论文阅读] Discovering Your Selling Points: Personalized Social Influential Tags Exploration
参考资料:Li, Yuchen, Ju Fan, Dongxiang Zhang, and Kian-Lee Tan. “Discovering your selling points: Personalized social influential tags exploration.” In Proceedings of the 2017 ACM International Conferen...原创 2018-03-26 15:21:52 · 480 阅读 · 0 评论