刷题0429

这篇文章介绍了如何根据小红书用户的搜索记录,识别出现频率大于等于3次的关键词,以构建用户画像。关键词提取算法以字典序和频次排序输出。
摘要由CSDN通过智能技术生成

小红书推荐系统

小红书有一个推荐系统,可以根据用户搜索的关键词推荐用户希望获取的内容。
现在给定小红的搜索记录(记录为分词后的结果),我们认为当一个单词出现的次数不少于3次时,该单词为“用户期望搜索的单词”,即称为关键词。请你根据小红的记录,输出小红的用户画像对应的所有关键词。

输入描述:一行字符串,仅由小写字母和空格组成。代表小红的搜索记录。 字符串长度不超过100000。

输出描述:小红所有的关键词。每行输入一个。你需要按照搜索频次从高到低输出。频次相同的,你需要按字典序升序输出。

示例1:kou red game red ok who game red karaoke yukari kou red red nani kou can koukou ongakugame game

输出:red game kou

import sys
for line in sys.stdin:
    input = line.split()
    wcount={}
    for word in input:
        if word in wcount:
            wcount[word]+=1
        else:
            wcount[word]=1
    output=[]
    for word,count in wcount.items():
        if count>2:
            output.append((count, word))
    output.sort(key=lambda x: (-int(x[0]), x[1]))
    for (count,word) in output:
        print(f"{word}")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值