感悟
mbskyhan
这个作者很懒,什么都没留下…
展开
-
在海量数据中寻找topK的一些思路分析
求前k个数从大数据量里面排序的前k个数,topk.思路1:维持k大小的数组数,然后求出数组的这个数组的最小值,当再输入k+1个数的时候,和最小的值比较,如果大于最小的值,则替换原先的最小值放入数组中。对于时间复杂度首先是先k个数比较k次然后对于每个数N-k都需要进行k次比较(N-K)k则总共是k+(N-K)k算法复杂度思路2:如果需要NlgK的复杂度则如何设计算法设计小顶堆的概念每次都和堆顶元素比较向下调整...原创 2021-03-20 22:59:50 · 226 阅读 · 0 评论 -
IT成长录
“少壮不努力,老大学IT”,初次听到这句话是我大学老师在一次上课时看到满班乱哄哄的气氛说的,当时以为他是嘲讽我们或者是略微自嘲呢,现在回想起来有些不一样的感觉。从自己第一份接触IT工作(也算不上是真正的码农)到现在的继续在IT领域里深造学习,感觉有点累,有点迷茫。有时候敲着那相同字母组合的各种算法的代码,真是有种苦苦的味道。真想着放弃基础的代码学习,但我深知一切学习都是积累的过程,伟大的程原创 2014-03-30 22:21:23 · 1376 阅读 · 1 评论 -
互联网--引领新技术的浪潮
正如本书序言所写那样,”20年前,没有人知道互联网。20年后的今天,原创 2014-11-03 21:59:58 · 1108 阅读 · 0 评论 -
我所了解的大数据
大数据如今越来越热,数据量再大不会用,放到那里也是存储垃圾。所以随着数据量的越来越大,对数据的各种处理和挖掘需求也很多。这就促进分布式存储和计算软件的快速发展,集群的规模也越来越大。从以前的某家公司的服务器规模一万台都让人吃惊,到现在的BAT的大型分布式集群的总服务器规模在几万到几十万之间也不觉得匪夷所思。我现在接触的也是一些云平台集群的搭建和一些算法的并行化处理(一般是基于Mapreduce原创 2014-11-07 21:52:05 · 1216 阅读 · 0 评论