python 文本txt转csv

python 文本txt转csv

txt格式:
每行一条文本数据及标签,中间用"\t"隔开。在这里插入图片描述
代码示例:

corpus_sentences = []
chi_labels = []
with open(txt_path, mode='r', encoding='utf-8') as fIn:
    lines =list(csv.reader(fIn, delimiter='\n'))
    for line in lines:
        top2column = line[0].replace('\n', '').split('\t')[:2]  # 获取前两列
        corpus_sentences.append(top2column[0])
        chi_labels.append(top2column[1])
with open(csv_path, 'w', encoding='utf-8') as t: 
    t.write(str('corpus_sentences')+'\t'+str('chi_labels')+'\n')
    for i in range(len(labels)):
        t.write(str(corpus_sentences[i])+'\t'+str(chi_labels[i])+'\n')    

得到CSV文件,可以通过以下代码查看:

df = pd.read_csv(csv_path,encoding='utf-8',sep='\t')
corpus_sentences = df['corpus_sentences'].tolist()
labels = df['chi_labels'].tolist()
print(chi_labels[:3])
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值