数据分析实战-Kaggle-Twitter情感识别-基于Spacy的语句提取

目录

 

一、题目解析

二、开发环境

三、数据分析过程


一、题目解析

英文题目:

"My ridiculous dog is amazing." [sentiment: positive]

With all of the tweets circulating every second it is hard to tell whether the sentiment behind a specific tweet will impact a company, or a person's, brand for being viral (positive), or devastate profit because it strikes a negative tone. Capturing sentiment in language is important in these times where decisions and reactions are created and updated in seconds. But, which words actually lead to the sentiment description? In this competition you will need to pick out the part of the tweet (word or phrase) that reflects the sentiment.

中文解析:其实我一开始没弄明白这是啥意思,直到看了数据,先给大家看数据吧。

train .csv

test.csv

最后需要提交的东西呢,就是select_text。所以题目的意思就是,根据text(这个是用户真正发的内容)去提取selected_text,就是提取原文中能代表用户心情的语句。目的是方便Twitter以后做舆论分析啥的吧,这个咱管不着。下面让我们开始我们的分析之旅。

二、开发环境

Windows10 + Jupter Notebook(这个选择也让我吃了大亏,写博客的时候没有办法直接上传,只能通过先转Latex再转

PDF再转长图,我都要死了,垃圾csdn的markdown。)

需要源码的同学可以在博客下面留言,我直接发。

三、数据分析过程

  • 7
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Data_Designer

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值