用到的模块: xlrd
运用到:字典dict列表list 读表格,
最后得到文件: txt
感言: 代码较简单, 实现的方法局限性较大. 希望大家一起指点交流, 谢谢.
词频统计:
有关素材:
代码如下:
( (相关注释和想法大都写在旁边的备注里了))
import xlrd
#定义读取指定列数据的函数, 并返回列表data
def readxls_bycol(path,colnum):
xl = xlrd.open_workbook(path)
table = xl.sheets()[0]
data =list(table.col_values(colnum))
print(data)
return data
#定义统计传入列表词频的函数. 并返回已经降序好的字典word_sort
def count_words(data):
word_list = []
word_dict = {}
for i in data :
word_list.extend(i.split('/')) # i.split('/')表示每个i元素按照/分割,放到单独一个小列表中, 这些i列表的集合用extend追加进word_list
word_set=set(word_list)
for x in word_set: #set 去重
num =word_list.count(x)