书生大模型实战营入门岛第二关

1.Python实现wordcount

对于目标问题,先简单将其功能实现分为四部进行。

  1. 文本预处理:统计时不区分大小写,所以首先需要将整个文本转换为小写。
  2. 提取单词:需要从文本中提取出所有单词,去除标点符号和其他非单词字符。
  3. 统计单词频率:对每个提取出来的单词进行计数,并存储到字典中。
  4. 返回结果:将统计结果返回给调用者。

那么第一步选择使用了text.lower()text这一函数,它会将字符串 中的所有字符转换为小写。

第二步提取单词,选择正则表达,从而决定了使用re.findall(r'\b\w+\b', text)来提取所有的单词,同时因为使用正则表达,需要设置import re用于引入re模块。

第三步使用Python 的 模块中的一种字典类型defaultdict,预先将每一个单词的数量都定为0,从而增加时只需要+1便可。

第四步return dict(word_count)defaultdictdict,将defaultdict类型的字典返回成普通类型的字典,从而更容易理解和使用。

2.Vscode连接InternStudio debug笔记

对于使用Vscode连接InternStudio debug,基本上可以分为一下几个步骤。

  1. 在 VS Code 中安装Remote - SSH扩展包从而拥有远程连接的基础条件。
  2. 使用预先配置好的SSH密钥进行连接。
  3. 然后再预定的位置创建python文件,并确保在本地和远程开发机上都安装了python相关的插件或者环境。
  4. 直接在本地的代码侧面设置断点,从而保证对于代码的每一步生效都有所把控。
  5. 在调试窗口配置代码的launch.json 文件,根据需要,修改 launch.json 中的配置,确保 program 指向你的 Python 脚本
  6. 在终端输入pip install debugpy,安装对应的debugpy,然后运行python -m debugpy --listen 5678 --wait-for-client ./myscript.py代码,要在对应的位置修改成python文件本身的存在位置,随后点击开始运行,便可以正常debug。

  • 8
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值