1、直接打开
with open("Kcr_positive_train.txt") as f:#直接打开就读文件,固定格式记住
Kcr_positive_train = f.readlines()#readlines把函数文件放到一个列表中,列表中的每个元素是一行
Kcr_positive_train = [s.strip() for s in Kcr_positive_train]#strip函数实用对字符串开头末尾剥离作用
把定义的正样本先放到列表中,
2、或者换种方式
lst1=[]
for line in open('D:kcr_neg_pos/Kcr_negative_train.fast', 'r', encoding='utf-8'):
line = line.splitlines() # 去掉换行符
lst1.append(line)
range() 函数可创建一个整数列表,一般用在 for 循环中。函数语法:range(start, stop[, step])
append()函数可以想列表末尾添加元素。
3、定义train_x和tran_y(训练集和标签)
train_x_p = np.array(lst4)
np.array()把列表转化为数组
4、定义标签1或者0
train_y = np.concatenate([np.ones((len(lst4),)), np.zeros((len(lst2),))], axis=0)#竖向拼接