政府工作报告分析

题目描述

在这里插入图片描述

问题1

import  jieba
def fenci(txt):#进行分词操纵
    f=open(txt,"r")#以读的方式打开
    datas=f.read()
    f.close()
    data=jieba.lcut(datas)#使用jieba库进行分词
    d={}#定义一个字典
    for i in data:
        if len(i)>=2:
            d[i]=d.get(i,0)+1
    lt=list(d.items())
    lt.sort(key=lambda x:x[1],reverse=True)
    return  lt
def result(lt):#打印结果
    for i in lt[:9]:#打印列表中的前9个元素
        print(i[0],":",i[1],end=",",sep="")#sep的作用是操作i[0]与i[1]之间的符号,默认的话是空格
    print("lt[9][0]",":",lt[9][1],sep="")#打印列表中的第十个元素
r1=fenci("data2018.txt")#将对应文件夹下的文件进行分词
r2=fenci("data2019.txt")
print(2019,end=":",sep="")
result(r2)#由于先打印出来的是2019,所以先调用2019文件
print(2018,end=":",sep="")
result(r1)

问题2

import jieba
def fenci(txt):#进行分词操作
    f=open(txt,"r")
    datas=f.read()
    f.close()
    data=jieba.lcut(datas)
    d={}
    for i in data:
        if len(i)>=2:
            d[i]=d.get(i,0)+1
    lt=list(d.items())
    lt.sort(key=lambda x:x[1],reverse=True)
    ls=[x[0] for x in lt[:10]]#获取x中的第一个元素,即就是想要的名称
    return ls
def result(lt):
    print(",".join(lt))
r1=fenci("data2018.txt")
r2=fenci("data2019.txt")
r3=[]#用来存储r1和r2相同的元素
for i in r1:#将r1与r2相同的元素合并,压入到列表r3中
    if i in r2:
        r3.append(i)
for i in r1:#去掉r1中压入r3中的元素
    if i in r3:
        r1.remove(i)
for i in r2:#去掉r2中压入r3中的元素
    if i in r3:
        r2.remove(i)
print("共有词语:",end="",sep="")
result(r3)
print("2019特有:",end="",sep="")
result(r2)
print("2018特有:",end="",sep="")
result(r1)
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

工程人永远在路上

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值