NLP
文章平均质量分 85
加油加油再加油x
这个作者很懒,什么都没留下…
展开
-
pytorch&numpy中与维度处理有关部分函数
前言此篇博客包含了很多常用的与数组维度处理有关函数,方便查阅numpynumpy中与维度处理有关函数个人感觉掌握下面这五个就足够用了np.concatente - 维度合并这个函数个人感觉是非常好用的,可以将多个数组按照某一维度进行合并。如下示例如上所示,可以对数组的axis维进行拼接,保证数组其他维度完全一样,否则会报错,多个数组也可以。np.tile - 数组重复堆叠利用np.tile可以对数组进行拓展,如下示例可以对数组某一维度进行堆叠,设第二个参数为args = (arg1,a原创 2021-09-02 02:15:05 · 1163 阅读 · 0 评论 -
【神经网络】正向传播和反向传播(结合具体例子)
神经网络神经网络结构如上,由三个层构成。X到H层使用relu激活函数,H到O层使用sigma激活函数。损失函数采用交叉熵。relu函数如下:relu=max(x,0)relu′=relu = max(x,0)relu' = relu=max(x,0)relu′=前向传播一上来写矩阵形式可能不太适合理解。我先针对单个神经元来写。X->H那么就是h1=relu()h_1 = relu()h1=relu()......原创 2021-08-20 02:46:07 · 2175 阅读 · 0 评论 -
【NLP-笔记】中文分词技术
中文分词简介在汉语中,词是以字为单位的,但是一篇文章的语义表达却仍然是以词来作为划分的。因此,在处理中文文本时,需要进行分词处理,将句子转化成为词的表示。这个切片过程就是中文分词,通过计算机自动识别出句子的词。规则分词通过构建字典,在切分语句时,将语句中的每个字符串与字典中的词逐一比较,找到则切分,找不到则不切分。正向最大匹配法从头开始匹配逆向最大匹配法双向最大匹配法统计分词混合分词中文分词工具——jieba...原创 2020-12-10 11:41:13 · 381 阅读 · 0 评论 -
【NLP-笔记】NLP前置技术解析
搭建Python的开发环境略正则表达式(re库)正则表达式规则python中 记得正则表达式加r,转原生字符串。regex = r"test"字符含义.任何单个字符*前一个字符0次或无限次拓展(0即为没有前一个字符)+前一个字符1次或无限次拓展?前一个字符0次或1次拓展|左右表达式任意一个{m}拓展前一个字符m次{m,n}拓展前一个字符m-n次^匹配字符串开头 例:^abc$匹配字符串结尾 例:abc$(原创 2020-08-03 20:23:22 · 341 阅读 · 0 评论 -
【NLP-笔记】开篇
前言最近,实验室有一个项目,做股市文本分析,通过定期获取股民关于股票的评论并结合其他因素来判定股票的涨跌情况。在读《python自然语言处理实战 核心技术与算法》 涂铭、刘祥、刘树春著。我打算出一系列关于此书的笔记。此书代码下载地址为:https://github.com/nlpinaction/learning-nlpNLP基础什么是NLPNLP基本概念NLP(Natural Language Processing,自然语言处理)是计算机科学领域以及人工智能领域的一个重要的研究方向,它研究用原创 2020-08-03 17:02:55 · 332 阅读 · 0 评论