任务一
请用Python实现一个wordcount函数,统计英文字符串中每个单词出现的次数。返回一个字典,key为单词,value为对应单词出现的次数。
TIPS:记得先去掉标点符号,然后把每个单词转换成小写。不需要考虑特别多的标点符号,只需要考虑实例输入中存在的就可以。
python代码如下:
import re # 导入正则表达式模块,用于灵活处理文本
def wordcount(text):
"""
统计英文字符串中每个单词出现的次数,返回一个字典。
参数:
text (str): 要统计的英文字符串。
返回:
dict: 统计结果字典,key为单词,value为出现次数。
"""
# 1. 清理文本:
# - 全部转换为小写,统一处理大小写
# - 去除标点符号,只保留单词
text = text.lower()
text = re.sub(r'[^\w\s]', '', text) # 使用正则表达式去除标点符号
# 2. 分割单词:
words = text.split() # 按空格分割成单词列表
# 3. 统计词频:
counts = {}
for word in words:
if word in counts:
counts[word] += 1 # 如果单词已存在,计数加1
else:
counts[word] = 1 # 否则,新增单词并初始化计数为1
return counts
# 示例用法
text = """Hello world!
This is an example.
Word count is fun.
Is it fun to count words?
Yes, it is fun!"""
result = wordcount(text)
print(result)
运行结果:
任务二
请使用本地vscode连接远程开发机,将上面你写的wordcount函数在开发机上进行debug,体验debug的全流程
添加了 stopOnEntry:true