NLP-读取csv文件

该博客介绍了处理CSV文件的几个步骤,包括理解数据格式,读取文件,更改列名,获取特定列信息以及如何对文件进行分割。在NLP任务中,作者展示了如何处理含有问题对和标注的CSV数据,用于问题相似度计算。
摘要由CSDN通过智能技术生成

赛题:问题相似度计算
网址:金融大脑-金融智能NLP服务

目录

1.数据格式:

行号\t句1\t句2\t标注,举例:1 花呗如何还款 花呗怎么还款 1
行号指当前问题对在训练集中的第几行;
句1和句2分别表示问题句对的两个句子;
标注指当前问题对的同义或不同义标注,同义为1,不同义为0。
这里写图片描述

2.读取文件:

import pandas as pd
data=pd.read_csv('./atec_nlp_sim_train.csv',sef='
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值