基于tflearn使用lstm实现文本分类

模型训练部分代码

# -*- coding: utf-8 -*-
from __future__ import division, print_function, absolute_import
import tflearn
import os
import numpy
import jieba
import sys
import random
import re
import fire
from sys import argv
import json
from tflearn.data_utils import to_categorical, pad_sequences
from tflearn.datasets import imdb

def load_data1( keywordPath,stopwords_set,filepath,dictfilepath,n_words, valid_portion=0.1,
               sort_by_len=True):
   

    #keywordPath = sys.argv[1]
    jieba.load_userdict(keywordPath)
    pathDir = os.listdir(filepath)

    data_set = []
    train_set_x = []
    train_set_y = []
    test_set_x = []
    test_set_y = []

    # 把停用词做成字典
    stopwords = {}
    fstop = open(stopwords_set, 'rb')
    for eachWord in fstop:
        stopwords[eachWord.strip().decode('utf-8', 'ignore')] = eachWord.strip().decode('utf-8', 'ignore')
    fstop.close()

    #写入词典
    f1 = open(dictfilepath, 'w', encoding='UTF-8')
    dic = dict()

    i = 0
    j = 0

    
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值