1. 抽取训练数据 和 验证集 5:1
2. 生产词表:0 开始 ;同时统计每个句子的term数量
3. kernel_size= {2,3,4} 就是3个模板,分布式 2* n,3 *n, 4*n
4.kernel_num 是卷积输出channel数
5.预测的整体思路:
(1) optimizer = torch.optim.Adam(net.parameters(), lr=0.01) #定义优化器
(2) criterion = nn.NLLLoss() #定义loss
(3) optimizer.zero_grad() #优化器梯度清零
(4)preds = model(inputs) 或者 out = net(inputs)#前馈计算,预测 结果
(5)loss = criterion(out,label)求解loss
(6)loss.backward() #反向传播求解梯度
(7) optimizer.step() #更新权重参数