![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
九霄王
这个作者很懒,什么都没留下…
展开
-
神经网络反向传播梯度计算数学原理
神经网络反向传播梯度计算数学原理import numpy as np# N is batch size; D_in is input dimension;# H is hidden dimension; D_out is output dimension.N, D_in, H, D_out = 64, 1000, 100, 10# Create random input and output datax = np.random.randn(N, D_in)y = np.random.ran原创 2021-11-17 10:46:41 · 252 阅读 · 0 评论 -
自动生成Word及Word的读取
Word的生成原创 2021-11-09 16:31:37 · 237 阅读 · 0 评论 -
python-docx 自动生成wrod文档或者解析Word文档内容
python-docx原创 2021-11-04 18:12:32 · 184 阅读 · 0 评论 -
LayOutLM的说明文档及huggingface模型的使用
LayOutLM的说明文档原创 2021-11-03 10:34:09 · 1074 阅读 · 0 评论 -
Hugging Face的bert模型 及微软的LayoutLM模型
Hugging Face的bert模型微软的LayoutLM模型原创 2021-07-11 16:41:20 · 378 阅读 · 0 评论 -
表格开源的数据集FUSD数据集、TableBank数据集、DocBank数据集
FUSD数据集FUSD数据集TableBank数据集 TableBank数据集DocBank数据集DocBank数据集原创 2021-07-11 12:54:57 · 1721 阅读 · 0 评论 -
DGL的学习
文档学习:DGL图神经网络文档的学习GitHub: GitHub地址原创 2021-07-05 13:27:27 · 127 阅读 · 0 评论 -
一文搞懂Pytorch内部机制
一文搞懂Pytorch内部机制原创 2021-06-04 15:03:19 · 119 阅读 · 0 评论 -
表格文档数据提取
博客论文微软表格抽取LayerOut原创 2021-06-03 14:29:56 · 186 阅读 · 0 评论 -
句子表示为向量
参考:句子表示为向量(上)原创 2021-05-19 14:13:02 · 142 阅读 · 0 评论 -
ernie和Bert的参数理解
BERT参数的理解bert参数量隐藏在每一层的shape当中。把如上shape累加即为全部参数量。总参数量=input_parm+12*encoder_parm=(30522+512+2)768+12(76812643+12643+6412768+768+768+768+7683072+3072+3072*768+768+768+768)=101675520个参数简单解释如下:input_parm=(30522+512+2)*768就是输入embeding层对应的参数,分别对应的是**token-em原创 2020-10-22 10:28:55 · 2669 阅读 · 0 评论 -
似然函数与交叉熵的区别
参考:似然函数与交叉熵的区别原创 2020-10-09 18:29:04 · 345 阅读 · 0 评论 -
pytorch-geometric学习
pytorch-geometric学习原创 2020-09-27 14:46:14 · 269 阅读 · 0 评论 -
反向传播的目的,及其为什么要从后向前计算梯度
1.反向传播的目的目的就是计算权重、偏置等超参数的梯度,方便用优化算法更新参数时用到2.为什么要从后向前计算梯度避免重复计算,从而加快计算速度参考:反向传播算法为什么要“反向”...原创 2020-09-07 14:23:25 · 3091 阅读 · 0 评论 -
理解mini-batch、Momentum、RMSpror、Admin优化算法
批量梯度下降(mini-batch)算法优点(1) 可以批量计算梯度,不会像随机梯度下降那样,持续靠近最小值的方向而不收敛,也不会像梯度下降那样一次性计算所有样本的梯度,导致耗时过长;(2)梯度下降时,Y轴上的摆动会减小,能够快速收敛缺点:(1)梯度下降时,会持续靠近最小值方向,也不一定在最小值的范围内收敛或波动,此时,需要调整学习率,才能收敛(2)总样本数较小的时候,不太适用(3)每一次Step,都是独立计算梯度的动量梯度下降(Momentum)算法v(t) = beta * v..原创 2020-09-05 15:14:38 · 319 阅读 · 0 评论 -
注意力机制总结
注意力机制总结原创 2020-08-26 17:09:10 · 205 阅读 · 0 评论 -
词嵌入word2vec、字词嵌入fastText、全局词嵌入Glove直接的联系与关系
参考:http://www.pengfoo.com/post/machine-learning/2017-04-11https://blog.csdn.net/u012879957/article/details/82735057动手学习深度学习原创 2020-06-18 14:07:17 · 232 阅读 · 0 评论 -
什么是预训练模型
参考原创 2020-06-06 12:01:19 · 6141 阅读 · 0 评论 -
Fine-tune保存的模型如何转化为一个PaddleHub Module
Fine-tune保存的模型如何转化为一个PaddleHub Module原创 2020-05-26 13:33:04 · 468 阅读 · 0 评论 -
动手学习深度学习的PDF电子版
动手学习深度学习的PDF电子版相应的视频Pytorch的Git地址原创 2020-05-22 19:51:39 · 1385 阅读 · 0 评论 -
语言表示的前世今生 以及 词向量的本质
语言表示的前世今生 词向量的本质原创 2020-05-18 10:50:22 · 164 阅读 · 0 评论 -
Git学习地址
Git学习地址原创 2020-04-20 15:36:25 · 127 阅读 · 0 评论 -
SVM推导的详细过程
参考:推导SVM的详细过程对偶问题:对偶问题原创 2020-04-11 17:53:44 · 281 阅读 · 0 评论 -
文本分类示例
git地址:分类git参考:说明原创 2020-03-12 12:57:19 · 478 阅读 · 0 评论 -
Paddle实现NLP-文本分类
参考:来源# 导入必要的包import osfrom multiprocessing import cpu_countimport numpy as npimport shutilimport paddleimport paddle.fluid as fluid# 创建数据集和数据字典data_root_path='/home/aistudio/data/data6825'...原创 2020-03-06 18:35:47 · 1556 阅读 · 0 评论 -
百度飞浆NLP模型
参考:百度飞浆NLP模型原创 2020-03-03 19:18:38 · 468 阅读 · 0 评论 -
Jupyter的使用与安装
jupyter的安装参考:Windows环境下Jupyter的安装tf.seras中CallBacks(回调函数)的使用(1)callback的目录结构:(2)代码的实现import matplotlib as mplimport matplotlib.pyplot as pltimport numpy as npimport sklearnimport panda...原创 2020-02-29 15:45:12 · 174 阅读 · 0 评论 -
Tensorflow实现简单的手写数字神经网络模型
import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data#对于使用FLAGS,则在终端上运行的命令python mnistClassify.py --is_train=0FLAGS = tf.app.flags.FLAGStf.app.flags.DEFINE_integer("is...原创 2020-02-21 15:12:25 · 222 阅读 · 0 评论 -
tensorflow一步一步实现一个线性回归预测模型
1.指定每段程序的作用域tf.variable_scope #指定作用域tf.variable_scope with tf.variable_scope("data"): # 1.准备数据, x 特征值 [100,1] y 目标值[100] # 指定均值为0.75 方差为0.5 x = tf.random_normal([100,...原创 2020-02-20 11:29:21 · 565 阅读 · 0 评论 -
RNN-LSTM-BiLSTM-CRF之间的联系与区别
参考:各个模型的区别与联系原创 2020-02-14 18:39:33 · 811 阅读 · 0 评论 -
中英文词向量
参考:中英文词向量GitHub:词向量表的GitHub地址原创 2020-01-13 09:09:41 · 488 阅读 · 0 评论 -
更换pip源到国内镜像
临时使用:可以在使用pip的时候在后面加上-i参数,指定pip源eg: pip install scrapy -i https://pypi.tuna.tsinghua.edu.cn/simple参考:pip镜像原创 2019-12-11 10:43:28 · 87 阅读 · 0 评论 -
深度学习环境搭建(ubuntu16.04+Titan Xp安装显卡驱动+Cuda9.0+cudnn)
参考:深度学习环境搭建原创 2019-12-10 17:55:57 · 362 阅读 · 0 评论 -
Lstm+CNN 文本分类
参考:分类算法原创 2019-12-10 14:58:46 · 1739 阅读 · 0 评论 -
THUCTC: 一个高效的中文文本分类工具包
参考:THUCTC原创 2019-12-10 13:13:03 · 550 阅读 · 0 评论 -
BERT源码分析及资料
参考:源码分析文章资料原创 2019-11-01 09:00:49 · 116 阅读 · 0 评论 -
BiLSTM-CRF模型中的CRF层讲解
参考:最通俗易懂的BiLSTM-CRF模型中的CRF层讲解代码:Bert-BiLSTM-CRF转载 2019-10-23 09:18:33 · 336 阅读 · 0 评论 -
定制你自己的CRF模型以及JAVA实现的Word2Vec模型和一些java版NLP的工具
定制自己的CRF模型JAVE 用户自定义词典这个项目是一个基本包.封装了大多数nlp项目中常用工具word2vec java版本的一个实现原创 2019-10-23 09:12:53 · 272 阅读 · 0 评论 -
机器阅读理解
1.机器阅读理解主要有几点:(1)词性的标注(动词,名词,形容词等。。)(2)分词(3)信息的提取(4)词性的匹配原创 2019-01-11 16:59:42 · 924 阅读 · 0 评论 -
NLP数据清洗
1.什么是数据清洗答:在对文本进行分析时,对不符合要求的数据进行处理。常见有几种:(1)数据重复处理(2)数据错误处理(3)数据缺失处理(4)数据异常处理参考:https://cloud.tencent.com/developer/article/13738542. 文本聚类答:参考:https://yq.aliyun.com/articles/26040...原创 2019-03-08 16:49:25 · 2190 阅读 · 0 评论