positive_data_dir = "data/train/pos"
negative_data_dir = "data/train/neg"
data_dirs = [negative_data_dir, positive_data_dir]
out_dir = "runs"
正负样本数据文件夹,以及最后输出的文件夹名称
文件夹里面是一个一个的txt,每一个文本代表一个样本包含以及预处理后的数据
document_length_limit = 1000
is_line_as_word = True
dev_sample_percentage = 0.1
文件的长度限制,用在哪?
一行是否是一个单词,后面创建字典的时候会用到
训练集与测试集划分的比例
num_classes = len(data_dirs) 分类个数,多分类or二分类,这里是二分类
embedding_size = 100
filter_sizes = [3, 4, 5] 卷积核大小
stride_h = 1 步长
num_filters = 128 卷积核大小
keep_prob_rate = 1.0
learning_rate = 1e-3 学习率
batch_size = 32 训练批次
ecoph_num = 100 迭代次数
evaluate_every = 10 每10此评估一次
checkpoint_every = 10 每10次保存一次
# is_finetune = False
is_finetune = True
is_bn = True # use batch norm or not 是否使用BN
l2_lambda = 0.0 正则化参数
decay_steps = 1000 每1000轮给学习率乘以0.5
decay_rate = 0.5