用python写一个简答的英文文章分析程序

前言

      本人是软件工程在校学生,萌新一枚,写此程序为了练习字符串处理函数。程序有bug,例如没法把文章中的数字处理掉,希望多多包涵,有什么改进的方法可以留言。

一、代码内容

filehandle=open("C:\\1.txt","r",encoding="ANSI")        #打开文件输入路径
for i in range(0,2):
    text=filehandle.read()
    text=text.lower()
    list= []
    list2=[]
    bin=[]
    di={}
    list3=[]
    text=text.replace(".","")                           #处理标点符号
    text=text.replace(",","")
    text=text.replace("?","")
    text=text.replace("\n\n","\n")
    text=text.replace("'s"," is")
    text=text.replace("\n"," ")
    text=text.replace("-"," ")
    text=text.replace("damn","")
    text=text.replace("hell","")
    text=text.replace("bitch","")                      #处理违禁字
    while text.find("\n")>0:
        text=text.replace("\n"," ")                  #查找并去除\n乱码情况
    while text.find("\n\n")>0:
        text=text.replace("\n\n"," ")                #查找并去除\n\n乱码情况
    while text.find(" ")>0 :
        word1=text[0:text.find(" ")]
        text=text[text.find(" ")+1:]
        list.append(word1)
    print("")
    list.append(text)

    for i in range(len(list)):
        list2.append(list.count(list[i-1]))
    di=dict(zip(list,list2))
    print(di)
    filehandle=open("C:\\2.txt","r",encoding="ANSI")   #分析两篇文章,本来想对比一下相似度,发现时间复杂度有点大,跑不出来

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值