教你用十行代码统计一篇文章的单词数量

[第一个问题代码] 

# 这个题目是把一些IP地址写到一个文本中,然后统计文本中IP地址出现的次数的排序
import random

with open("ip.txt","w+") as fp:
    for i in range(12000):
        num1 = random.randint(1, 255)
        num2 = "172.25.254." + str(num1) + "\n"
        fp.write(num2)
    # 将光标移动到文本的开头
    fp.seek(0)
    dict1 = {}
    for ip in fp:
        # 去除首尾的\n符号
        ip = ip.strip()
        dict1[ip] = dict1.get(ip,0) + 1
    print("下面这些ip地址中出现频率前十的是:")
    print(sorted(dict1.items(), key=lambda x: x[1], reverse=True)[:10])

[第二个问题代码]

import string

with open('Walden.txt', 'r',encoding="utf-8-sig") as file:  # 换成"utf-8-sig"避免了"\ufeff"(字节序)的出现
    article = file.read().lower()
    # 找出这些特殊字符,!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
    _punctuation = string.punctuation
    no_pun_text = article
    for pun in _punctuation:
        no_pun_text = no_pun_text.replace(pun,'')
    print(no_pun_text)
    records = dict()
    # 方法通过指定分隔符对字符串进行分割并返回一个列表,默认分隔符为空字符,包括空格,换行(\n), 制表符(\t)等
    for word in no_pun_text.split():
        records[word] = records.get(word, 0) + 1  # 若是找到了一样的word就让这个键值+1
    # 把字典的键值转化为一个列表,然后根据列表的每一个元素下标为"1"的值的大小进行排序,这个函数出来就是列表,reverse=True,是降序
    items = sorted(records.items(), key=lambda x: x[1], reverse=True)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

FanMY_71

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值