字(words)=?字节(byte)=?比特(bit)

1字节(byte) = 8位(bit)

16位的系统中(比如8086微机) 1字 (word)= 2字节(byte)= 16(bit)
32位的系统中(比如win32) 1字(word)= 4字节(byte)=32(bit)
64位的系统中(比如win64)1字(word)= 8字节(byte)=64(bit)

另外,只有char类型是被规定为8位,其他数据类型都没有被强制规定具体位数

一个cache line通常为64byte,每次可以取8个字word在这里插入图片描述

在这里插入图片描述

这段代码的功能是:读取一个文件中的同义词,统计一个文本中单词出现的频率并按照频率排序,最后输出每个单词及其出现的次数。 具体每一步的解释如下: 1. `synonyms = open(r"D:\课程资料\大二下\信息分析文件\大作业\图书馆同义词.txt", 'r', encoding='utf-8')`:打开一个文件,读取其中的同义词。这里使用了 `r` 模式表示读取文件。`encoding='utf-8'` 表示文件使用的编码方式是 UTF-8。 2. `synonyms_dict = {}`:建立一个空典,用于存储同义词。同义词将使用典的键值对进行存储。 3. `for line in synonyms:`:遍历文件中的每一行。 4. `line = line.strip().split()`:去除每一行的空格并将其分割成单词。 5. `for word in line:`:遍历每一行中的每一个单词。 6. `synonyms_dict[word] = line[0]`:将每个单词作为键,将该行的第一个单词作为值,存储到同义词典中。这是一个简单的处理方式,即将同一行中的所有单词都视为同义词的关系。 7. `for i in range(len(words_filtered)):`:遍历文本中的每一个单词。 8. `if words_filtered[i] in synonyms_dict:`:如果当前单词在同义词典中存在。 9. `words_filtered[i] = synonyms_dict[words_filtered[i]]`:将当前单词替换为同义词典中的第一个同义词。 10. `words_counts[words_filtered[i]] = words_counts.get(words_filtered[i], 0) + 1`:统计每个单词出现的次数。如果该单词在典中已经存在,则将其出现次数加 1;否则将其出现次数设为 111. `words_list = list(words_counts.items())`:将单词及其出现次数转化为列表。 12. `words_list.sort(key=lambda x: x[1], reverse=True)`:按照单词出现次数从大到小对列表进行排序。 13. `ranking = []`:建立一个空列表,用于存储每个单词及其出现次数。 14. `for i in range(len(words_list)):`:遍历排序后的列表。 15. `ranking.append(words_list[i])`:将每个单词及其出现次数添加到排名列表中。 16. `ranking_dict = dict(ranking)`:将排名列表转化为典,以便最后输出每个单词及其出现次数。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值