题目描述
问题1
f=open("data.txt","r",encoding="utf-8")#打开这个文件夹,以utf-8编码来实现读取文件内容
fi=open("clean.txt","w")
data=f.read()
f.close()
s=""#定义一个字符串用来存储新的内容
word=",。!”“、; 《》() “” "#用来存储中文的标点符号
for i in data:
if i not in word:
s+=i#实现字符串的写入
fi.write(s)#将s写入到字符串文件中
fi.close()
问题2
import jieba
f=open("clean.txt","r")
datas=f.read()
data=jieba.lcut(datas)
d={}
for i in data:
if len(i)>=3:
d[i]=d.get(i,0)+1
l=list(d.items())
l.sort(key=lambda x:x[1],reverse=True)
for i in l[:9]:
print(i[0],":",i[1],end=",",sep="")
print(l[9][0],":",l[9][1],sep="")
f.close()