Python简单词频统计以及格式合并实现

用到的模块: xlrd
运用到:字典dict列表list 读表格,
​最后得到文件: txt

感言: 代码较简单, 实现的方法局限性较大. 希望大家一起指点交流, 谢谢.


词频统计:

有关素材:

材料1

代码如下:
( (相关注释和想法大都写在旁边的备注里了))

import xlrd
#定义读取指定列数据的函数, 并返回列表data
def readxls_bycol(path,colnum):
    xl = xlrd.open_workbook(path)  
    table = xl.sheets()[0]
    data =list(table.col_values(colnum))  
    print(data)
    return data


#定义统计传入列表词频的函数. 并返回已经降序好的字典word_sort
def count_words(data):
    word_list = []
    word_dict = {} 
    for i in data :
        word_list.extend(i.split('/'))  # i.split('/')表示每个i元素按照/分割,放到单独一个小列表中,  这些i列表的集合用extend追加进word_list
    word_set=set(word_list)
    for x in word_set:   #set 去重
        num =word_list.count(x)  
  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值