神经网络
lpossible
这个作者很懒,什么都没留下…
展开
-
苏建林DGCNN模型代码详解
1.说明以下代码为苏神参加百度信息抽取比赛提出的DGCNN模型代码,其源码基本是没有注释的,所以本文对大部分代码做了注释,可能有不对的地方,可以指出。另一个就是对keras3.x版本下Attention模块的计算做了修改。2.代码注释#! -*- coding:utf-8 -*-from __future__ import print_functionimport jsonimport osimport refrom random import choice# 关键词匹配工.原创 2020-12-03 17:35:00 · 4035 阅读 · 8 评论 -
关于keras.sum()和kears.softmax()等函数中维度的理解
1.目的神经网络中对数据处理一般有求和,求均值等操作,这就需要用到sum、softmax和mean等函数,而这些函数中一般都有设置处理维度axis的参数选择。2.设置1.不作axis设置sum和mean等函数会对整个数据做相应操作,具体如下:import numpy as npimport keras.backend as kconstant = np.array([[1, 2, 3], [2, 2, 3], [3, 2, 3]])print(constant)constant原创 2020-08-16 21:16:52 · 4066 阅读 · 0 评论 -
Keras中出现错误tensorflow.python.framework.errors_impl.InvalidArgumentError等错误
1.完整错误提示tensorflow.python.framework.errors_impl.InvalidArgumentError: Input to reshape is a tensor with 100 values, but the requested shape has 2002.错误原因在使用keras搭建网络时出现这种错误我的理解是模型结构基本是没有问题的,这个提示一般是在输入数据训练时会出现,也就是会提示在model.fit()阶段出错。当然建议使用summary函数对模型原创 2020-06-03 21:03:11 · 9587 阅读 · 0 评论 -
Keras2.0如何使用预训练的词向量(SelfEmbedding)
在自然语言处理时,会经常涉及到对输入进行Embedding,训练神经网络有两种Embedding方式,一种是直接调用tensorflow自带的Emdedding层,另一种就是自己建立一个Embedding层,加载自己的预训练词向量。1.预训练词向量哪里来一般来说由于标注数据和为标注数据的比列差距太大,所以会考虑利用未标注数据训练一个领域的特征词向量。这样可以最大程度的利用语...原创 2019-12-30 10:50:22 · 2405 阅读 · 0 评论 -
神经网络多元线性回归
#jupyter notebookimport pandas as pdimport numpy as npimport tensorflow as tfimport matplotlib.pyplot as plt%matplotlib inline# 数据链接: https://pan.baidu.com/s/1cXeXVaBdXtjJnC0Dl__8pw提取码: ...原创 2019-11-12 12:15:48 · 4485 阅读 · 2 评论 -
LSTM网络的输入输出的维度和值的理解
1 引言 相信很多使用LSTM网络的初学者跟我一样,需要从刚开始不会用,再到只是会用LSTM写模型,最后基本理解LSTM的网络结构及输入输出。2 对LSTM网络的分析 LSTM网络从概念上讲,主要包括四个门,依次为遗忘门f,输入门i,更新门g和输出门o。如下图上图对于每一个门有形式化语言: f=sigmoid(Wf(x(t),h(...原创 2019-12-02 18:22:06 · 14677 阅读 · 4 评论 -
关于神经网络训练的坑(语料太少)
我们在搭建神经网络时,大家的网络模型大同小异,但是语料的差别还是蛮大的,不管是大小还是领域,所以我就遇到这样的事。 故事的起因是因为我手里有一份很小的语料,大概有2000句左右,我构建了多层网络去做词性识别,但是我由于只想测试模型的效果,所以每次只是象征性的跑一次,结果训练时的准确度还有95%左右,但是预测提取实体时,怎么都提取不到正确的实体。也就是说实体识别数为0,经过一下午的实...原创 2019-12-25 18:16:51 · 1441 阅读 · 0 评论