动手学深度学习PyTorch版_第二次打卡

最新推荐文章于 2023-02-20 19:32:08 发布

Uncle_Sugar

最新推荐文章于 2023-02-20 19:32:08 发布

阅读量210

点赞数

分类专栏：动手学深度学习Pytorch版

本文链接：https://blog.csdn.net/sinat_29278271/article/details/104316047

版权

动手学深度学习Pytorch版专栏收录该内容

7 篇文章 0 订阅

订阅专栏

全部JupyterNotebook来自

https://github.com/ShusenTang/Dive-into-DL-PyTorch

主要是做一些基础知识的记录

第二次的内容是文本预处理，语言模型，循环神经网络基础。

1.re

re 即正则表达式 regular expression。从这段代码上看，python 的写法确实优雅re.sub（a, b, c）是将c中所有a的子串替换成b。

这里使用了一个正则表达式[^a-z]+，代表所有长度大于1的非小写字母构成的子串。但是，先re.sub(), 然后再strip 会比较合理。非字母的字符经过转换后可能会在末尾留下空格。

import collections
import re

def read_time_machine():
    with open('/home/kesci/input/timemachine7163/timemachine.txt', 'r') as f:
        lines = [re.sub('[^a-z]+', ' ', line.strip().lower()) for line in f]
    return lines


lines = read_time_machine()
print('# sentences %d' % len(lines))

2.看的我心累，在书上都看过，等transformer吧

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Uncle_Sugar

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
动手学深度学习PyTorch版_第二次打卡

全部JupyterNotebook来自https://github.com/ShusenTang/Dive-into-DL-PyTorch主要是做一些基础知识的记录第二次的内容是文本预处理，语言模型，循环神经网络基础。1.rere 即正则表达式 regular expression。从这段代码上看，python 的写法确实优雅re.sub（a, b, c）是将c中所有a的子串替...
复制链接

扫一扫