《编程之美》读书笔记: 寻找发帖水王的扩展题

最近,零零散散的看了《编程之美》这本书的一两道题,发现都是挺有趣的题目,书里面的思路很好,看完后启发真不少,其中有一道叫“寻找发帖水王”的题目,用一般思路去解决,时间复杂度会是ON * log2N + N)。但换一种简单的思路却可以是ON),这对程序来说,在运行效率上应该是质的飞跃了。

原题目如下:http://www.msra.cn/Articles/ArticleItem.aspx?Guid=24dd6639-53d7-4b75-a55e-10eef4f3083e#.

为了方便说明,贴出题目伪代码如下:

  

 

 

 

其中最后,有一道扩展题,题目如下:

随着Tango的发展,管理员发现,超级水王没有了。统计结果表明,有3个发帖很多的ID,他们的发帖数目都超过了帖子总数目N1/4。你能从发帖ID列表中快速找出他们的ID吗?

这道题显然还是用原题中的思路去解决,但问题复杂了,由原来的一个水王,变成了3个,且他们的总数目皆超过总体数的1/4。我的思路如下:

    首先,上题思路是,当遍历ID与当前ID(candidate变量)不同时,当前ID(candidate变量)所遍历到的个数减1(nTimes - 1),相同则遍历数加1,当nTimes等于0时,就说明,当前ID遍历到的个数为0或已被抵消为0,那当前ID就等于新遍历到的ID,且其遍历数赋为1(当然这个新遍历到的ID可以等于当前),这就意味着,整个遍历下来,相同的ID都会被累加起来,而不同ID之间会互相抵消,最后剩下来的candidate变量就是灌水王ID,但我们能保证一定是灌水王的ID吗?让我们假设一种最极端的状况就是,所有非灌水王ID都与灌水王ID抵消,但因为,灌水王占大于总帖数一半的帖数,故其总遍历数减去所有帖子数,总会大于0,所以最终返回的condidate变量总会是灌水王的ID。

   有了上题的思路之后,我们就着手于这一题了。上题只需要一个结果,而现在需要3个结果,所以我们考虑数组作为返回值,同时,上题用到的nTimes,也应改为一个大小为3的数组。我们要如何保证最终返回的数组的3个元素就是3个灌水最多的用户呢?首先分析其所占比例,各超过1/4,也就是说剩下的其它ID所占帖数就不足总帖数1/4了。现在我们需要3个变量来记录当前遍历过的3个不同的ID,而nTimes的3个元素分别对应当前遍历过的3个ID出现的个数。如果遍历中有某个ID不同于这3个当前ID,我们就判断当前3个ID是否有某个的nTimes为0,如果有,那这个新遍历的ID就取而代之,并赋1为它的遍历数(即nTimes减1),如果当前3个ID的nTimes皆不为0,则3个ID的nTimes皆减去1,这也就是解决本文题的关键了。由于非水王ID不满总帖数的1/4,与上题思路相同,所遍历ID与当前3个ID不同时,就一同抵消(即3个当前ID的nTimes值减1),最终留下来的3个当前ID总会是3个超过1/4的水王ID。

 

具体算法伪代码如下:(写的比较复杂,没有做代码优化)

   

 

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值