Python学习:词频统计(zip、set、split、len 函数)的应用

词频统计

一、编辑字符串

1、字符链接 — zip( )

请添加图片描述

2、创建不重复集合— set( )

请添加图片描述

3、字符串分隔 — split( )

请添加图片描述

4、获取字符串长度 — len( )

  1. 通过len()计算字符串长度时,不区分英文、数字和汉字,都按一个字符计算。
  2. 采用utf-8编码的字符串,一个汉字当3个字节。
  3. 采用gbk编码的字符串,一个汉字当2个字节。

请添加图片描述

二、词频统计请添加图片描述

# -*- coding: utf-8 -*-
'''
功能:词频统计
作者:zwh
日期:2021/11/21
'''

text = 'I love python I love java I learn python'
# 拆分
words = text.split(' ')
# 去重
diff_words = list(set(words))

# 统计单词个数的列表
counts = []
for i in range(len(diff_words)):
    counts.append(0)

# 遍历单词列表,统计各个单词的个数
for i in range(len(words)):
    for j in range(len(diff_words)):
        if diff_words[j] == words[i]:
            counts[j] = counts[j] + 1

# 输出统计结果
for word_count in zip(diff_words, counts):
    print(word_count)


学习提示:

Details determine success or failure!
细节决定成败!

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值