用wordcloud模块生成词云

绘制词云

在 pubmed 中检索关键词 "antibody drug conjugate",得到文献的summary后生成词云

from Bio import Entrez
from wordcloud import WordCloud
# 在 pubmed 中检索关键词 "antibody drug conjugate",得到文献的summary后生产词云图
handle = Entrez.esearch(db="pubmed", usehistory='y', term="antibody and  drug and conjugate")
record = Entrez.read(handle)
web_env = record['WebEnv']
query_key = record['QueryKey']
handle = Entrez.efetch(db="pubmed", WebEnv=web_env, query_key=query_key, rettype="abstract", retmode='text')
with open('data.txt', "w", encoding="utf-8") as f:
    f.write(handle.read())

with open('data.txt', "r", encoding="utf-8") as f:
    text = f.read()
filter_list = ["Author", "information", "[Indexed", "MEDLINE]", "PMID:", "antibody", "drug", "conjugate"]

filtered_text  = []
text_list = text.split()
# 过滤掉一些意义不大,却频率很高的词
for w in text_list:
    if w not in filter_list:
        filtered_text.append(w)

text = ' '.join(filtered_text)
wc = WordCloud(width=1200, height=800)
wc.generate(text)
wc.to_file("word_cloud.png")
# todo 生成的词云没有给出很有意义的信息,需要进一步过滤单词

word_cloud

转载于:https://www.cnblogs.com/YajunRan/p/11414980.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值