5-46 新浪微博热门话题 (30分)

原创 2016年08月31日 11:17:03

5-46 新浪微博热门话题 (30分)

新浪微博可以在发言中嵌入“话题”,即将发言中的话题文字写在一对“#”之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话题。新浪微博还会随时更新热门话题列表,并将最热门的话题放在醒目的位置推荐大家关注。

本题目要求实现一个简化的热门话题推荐功能,从大量英文(因为中文分词处理比较麻烦)微博中解析出话题,找出被最多条微博提到的话题。
输入格式:

输入说明:输入首先给出一个正整数N(105​​),随后N行,每行给出一条英文微博,其长度不超过140个字符。任何包含在一对最近的#中的内容均被认为是一个话题,如果长度超过40个字符,则只保留前40个字符。输入保证#成对出现。
输出格式:

第一行输出被最多条微博提到的话题,第二行输出其被提到的微博条数。如果这样的话题不唯一,则输出按字母序最小的话题,并在第三行输出And k more …,其中k是另外几条热门话题的条数。输入保证至少存在一条话题。
输入样例:

4
This is a #test of topic#.
Another #Test of topic.#
This is a #Hot# #Hot# topic
Another #hot!# #Hot# topic

输出样例:

Hot
2
And 1 more ...

思路
从测试案例来说,判断共同话题的时候应该是要忽略大小写、忽略标点符号的,可是,在输出的时后又要输出按字母序最小的话题,也就是说必须保留输入话题的原样(至少那个可能要被输出的话题要保留原样)。同5-44一般,我想试试哈希表,将每一个读入的话题放进去,对于相似话题直接合并并比较更新其为字母序最小的话题。
最后再做输出的时候就要遍历整个哈希表,找到题目要求的那些东西。
*需要验证的问题#PA#和#P A#算不算同一个话题

点击访问 PTA-测验

版权声明:写这些东西还是问了交流进步,如果你有不同的方法、见解,欢迎交流分享。文章中附的代码只传达当时我的一种做法,并非我认为最好的。

PTA 7-18 新浪微博热门话题

新浪微博可以在发言中嵌入“话题”,即将发言中的话题文字写在一对“#”之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话题。新浪微博还会随时更新热门话题列表,并将最热门的话题...
  • hao_zong_yin
  • hao_zong_yin
  • 2017年10月25日 00:54
  • 868

騰讯公司十二周年有礼欢乐送庆典≥

腾讯公司总部领奖专线【℡0755↗33.64↗8489↗℡】【帮您解决任何的疑难问题】腾讯公司抽奖备案专线【℡00861↗300505↗1850℡】【帮您解决任何的疑难问题】郑重声明:QQ用户如有收到...
  • zhijunqq
  • zhijunqq
  • 2011年05月02日 02:34
  • 0

模仿发表新微博的输入话题

项目需要实现如下效果:    这边我实现的思路是,监听textView的变化,然后用enumerateSubstringsInRange扫描所有字符,动态设置文本的颜色,见下: - (void...
  • u012724393
  • u012724393
  • 2015年11月15日 11:06
  • 905

Python 获取新浪微博的热门话题 (API)

Python 获取新浪微博的热门话题 (API)
  • guaguastd
  • guaguastd
  • 2014年06月27日 07:27
  • 2036

网页数据采集:[5]新浪微博api详细教程

假如我们使用vba来采集新浪微博的数据,我们最好是使用新浪微博开放平台api进行采集,当然,想要使用api必须有app key,在上一篇文章【新浪微博app key申请教程】中我们介绍了app key...
  • yw1688
  • yw1688
  • 2014年01月07日 16:00
  • 704

解析新浪微博 接口返回值中的时间 "Thu Aug 16 09:46:53 +0800 2012"

代码看起来有点乱,但是很简单  package DATE; import java.text.SimpleDateFormat; import java.util.Calendar; /...
  • zgf1991
  • zgf1991
  • 2012年08月16日 13:05
  • 3145

PTA 7-18(查找) 新浪微博热门话题(30 分) 30分代码 (已更新)

很蛋疼,,实在测不出哪里错了 还有 题目中说 保留前40个字符也错了,不处理就对了(怀疑这题有问题 方法就是 map 映射 (注:博客作为交流使用,切勿抄袭应付作业) #include us...
  • xiang_6
  • xiang_6
  • 2017年10月11日 10:53
  • 874

《数据结构学习与实验指导》5-7:新浪微博热门话题

实验内容:新浪博客可以在发言中嵌入“话题”,即将发言中的话题文字写在一对“#”之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或相似的话题。新浪微博还会随时更新热门话题列表,并将最热...
  • henuni
  • henuni
  • 2017年07月23日 13:16
  • 475

新浪微博数据挖掘(python)本周人们在讨论的热门话题的提取

分析热门话题微博: (1)人们在讨论(查询)什么话题(热门话题) (2)该话题下的微博获取 (3)那些人转发了微博(涉及的人物) (4)转发的时间和地点(话题的在时间和空间上的影响度) (5...
  • qq_20725287
  • qq_20725287
  • 2015年04月23日 19:53
  • 1113

pta 5-2 喊山 (30分)

5-2 喊山 (30分) 喊山,是人双手围在嘴边成喇叭状,对着远方高山发出“喂—喂喂—喂喂喂……”的呼唤。呼唤声通过空气的传递,回荡于深谷之间,传送到人们耳中,发出约定俗成的“讯号”,达到声讯...
  • bbbbswbq
  • bbbbswbq
  • 2017年03月30日 08:25
  • 292
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:5-46 新浪微博热门话题 (30分)
举报原因:
原因补充:

(最多只允许输入30个字)