《Kaggle》Kaggle比赛怎么进行数据分析
前言
最近在找到 Kaggle 的一个比赛 Tweet Sentiment Extraction | Extract support phrases for sentiment labels
比赛任务
例子:
“My ridiculous dog is amazing.” [sentiment: positive]
从这个例子可以看出,在进行tweet的语义分析时,我们往往是根据其中的某一些关键词来进行情感判断,如该例子中,我们可以很明显的通过“amazing”这个词得出这句话属于positive【积极的】,但从中也可以看出存在一些干扰项,如“ridiculous”,如果只看到这个词有可能模型就会错误的得出这句话的情感是negative【消极的】
数据集样例
在了解了该任务的具体要求后,我们首先第一步就是得到了数据集,通常包含三个数据集
train.csv