自然语言处理实践(新闻文本分类)
自然语言处理( NLP )是信息时代最重要的技术之一,也是人工智能的重要组成部分。NLP的应用无处不在,因为人们几乎用语言交流一切:网络搜索、广告、电子邮件、客户服务、语言翻译、医疗报告等。近年来,深度学习方法在许多不同的NLP任务中获得了非常高的性能,使用了不需要传统的、任务特定的特征工程的单个端到端神经模型。在本课程中,学生将全面了解NLP深度学习的前沿研究。通过讲座、作业和最终项目,学生将学习设计、实现和理解他们自己的神经网络模型的必要技能。
赛题理解
- 赛题数据
根据赛题提供的train_set.csv文件,通过pandas读出数据。
可知该数据集包含两万个数据。
查看label类别有0~13共14种。根据赛题介绍,对应关系如下:
> {
'科技': 0, '股票'