- 博客(4)
- 收藏
- 关注
原创 自然语言处理的n-Gram模型介绍
导航一、什么是n-gram模型二、n-gram模型用于评估语句是否合理三、二元语言模型判断句子是否合理一、什么是n-gram模型N-Gram是一种基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行大小为N的滑动窗口操作,形成了长度是N的字节片段序列。每一个字节片段称为gram,对所有gram的出现频度进行统计,并且按照事先设定好的阈值进行过滤,形成关键gram列表,也就是这个文本的向量特征空间,列表中的每一种gram就是一个特征向量维度。该模型基于这样一种假设,第N个词的出现只与前面
2021-02-20 11:22:11 1379
原创 正则表达式向前查找向后查找,环绕或零宽断言
向前查找:根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找,出现在指定项之后的字符序列不会被正则表达式引擎返回。向后查找:一个要匹配的字符序列前面有或者没有指定的字符序列(?元字符3.1 (?:…) 非捕获组3.2 (?=…) 肯定式向前查找3.3 (?!..) 否定式向前查找3.4 (?<=…) 肯定式向后查找3.5 (?<!..) 否..
2021-01-20 11:32:51 371
原创 DeepLearning——Dropout知识点总结
文章目录前言一、Dropout1.定义2.作用3.原因4.知识点前言一、Dropout1.定义dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。注意是暂时,对于随机梯度下降来说,由于是随机丢弃,故而每一个mini-batch都在训练不同的网络。2.作用做分类时,为了防止过拟合,提高模型泛化能力,Dropout 层一般加在全连接层。至于为何不加在卷积层,是因为卷积层参数较少,加入dropout作用甚微。较低层,有噪音,较高层,全连接层可以增加模型的
2021-01-14 10:32:27 377
原创 python爬虫实战01:爬取天气网天气
python爬虫实战01:爬取天气网天气文章目录python爬虫实战01:爬取天气网天气1.介绍2.完整代码3.外部调用1.介绍python3使用urllib和BeautifulSoup模块爬取天气网的信息: https://www.tianqi.com/.2.完整代码parser_weather.pyimport urllibfrom bs4 import BeautifulSoupimport urllib.requestclass weather(object): d
2020-08-24 16:30:34 1316
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人