rnn学习,keras rnn实践文本生成

最新推荐文章于 2022-12-24 11:47:44 发布

SelForcemiles

最新推荐文章于 2022-12-24 11:47:44 发布

阅读量4.2k

点赞数 2

分类专栏：机器学习

本文链接：https://blog.csdn.net/cai13160674275/article/details/72599049

版权

机器学习专栏收录该内容

17 篇文章 1 订阅

订阅专栏

参考

实践上与上面还是有差别，通过实践理解更深刻了

其实就是看到cs231n课堂上用rnn生成文本，然后就想用keras试试看，顺便复习复习python语法，有点生疏了，小技巧比较多

课堂的例子(需要翻墙)不得不说人家一百行代码效果就非常好，而且是纯python，不用任何框架辅助，佩服

import keras
import word2vec

import numpy as np 
from keras.utils import plot_model
from keras.preprocessing.image import ImageDataGenerator
from keras.models import *
from keras.layers import *
from keras.callbacks import *
from keras import backend as K
import h5py

filename = "input.txt"
raw_text = open(filename).read()
raw_text = raw_text.lower()

chars = sorted(list(set(raw_text)))
char_to_int = dict((c, i) for i, c in enumerate(chars))
int_to_char = dict((i, c) for i, c in enumerate(chars))

n_chars = len(raw_text)
n_vocab = len(chars)

print 'vocal: ',n_vocab
# data = open('input.txt','r').read()
# data=data.lower()
#上面基本都是仿照课堂上老师给的源码
seq_length = 32
dataX = []
dataY = []
for i in range(0, n_chars - seq_length, 1):
    seq_in = raw_text[i:i + seq_length]
    seq_out = raw_text[i + seq_length]
    dataX.append([char_to_int[char] for char in seq_in])
    dataY.append(char_to_int[seq_out])

n_patterns = len(dataX)

print "Total Patterns: ", n_patterns

# reshape X to be [samples, time steps, features]
X = np.reshape(dataX, (n_patterns, seq_length, 1))
# X = X / n_vocab #归一化后效果不好
#下面可以用函数直接转成多元分类的 ，例如:valY = np_utils.to_categorical(valY, num_classes=NUM_CLASS)
Y = []
for i in range(n_patterns):
    y = np.zeros((n_vocab, 1))
    y[dataY[i]] = 1
    Y.append(y)
Y = np.reshape(Y, (n_patterns, n_vocab))

print Y.shape

#设置检查点，保存权重
filepath="weights-improvement-{epoch:02d}-{loss:.4f}.hdf5"
checkpoint = ModelCheckpoint(filepath, monitor='loss', verbose=1, save_best_only=True, mode='min')
callbacks_list = [checkpoint]


model = Sequential()
model.add(LSTM(64, input_shape=(X.shape[1], X.shape[2]),return_sequences=True))
# # model.add(LSTM(32,return_sequences=True))
# model.add(LSTM(8))

# model.add(LSTM(
#     batch_input_shape=(None, TIME_STEPS, INPUT_SIZE),       # Or: input_dim=INPUT_SIZE, input_length=TIME_STEPS,
#     output_dim=CELL_SIZE,
#     return_sequences=True,      # True: output at all steps. False: output as last step.
#     stateful=True,              # True: the final state of batch1 is feed into the initial state of batch2
# ))

# model.add(Dropout(0.2))


model.add(Dense(n_vocab,activation='softmax'))
adam=keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08)
adagrad=keras.optimizers.Adagrad(lr=0.001, epsilon=1e-06)
model.compile(loss='categorical_crossentropy', optimizer='adam')

print model.layers[1].input  #use the index of layer to find the input and output shape
print model.layers[1].output

plot_model(model, to_file='model.png')
#尝试过多层rnn和单层不同宽度，效果都不怎么好，而且收敛很慢，而且这样的实现和老师的代码算法上还是有很大区别的，最终效果loss在0.1以下会生产一些单词，句子基本不可读
#model.fit(X, Y, nb_epoch=20, batch_size=128, callbacks=callbacks_list)
# model.fit(X, Y, epochs=500, batch_size=128)
# model.save('word_pre.h5')

SelForcemiles

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
rnn学习,keras rnn实践文本生成

参考实践上与上面还是有差别，通过实践理解更深刻了其实就是看到cs231n课堂上用rnn生成文本，然后就想用keras试试看，顺便复习复习python语法，有点生疏了，小技巧比较多课堂的例子(需要翻墙)不得不说人家一百行代码效果就非常好，而且是纯python，不用任何框架辅助，佩服import kerasimport word2vecimport numpy as
复制链接

扫一扫