NLP
文章平均质量分 86
Yoky615
安心学习,吃透的才是自己的
展开
-
【NLP】TIANCHI新闻文本分类-Task2.数据读取与数据分析
数据读取与数据分析 本章主要内容为数据读取和数据分析,具体使用Pandas库完成数据读取操作,并对赛题数据进行分析构成。 学习目标 学习使用Pandas读取赛题数据 分析赛题数据的分布规律 数据读取 赛题数据虽然是文本数据,每个新闻是不定长的,但任然使用csv格式进行存储。因此可以直接用Pandas完成数据读取的操作。Pandas 是基于NumPy 的一种工具,为了解决数据分析任务而创建的,Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。 数据读取代码: impor转载 2021-05-09 14:06:49 · 117 阅读 · 0 评论 -
【NLP】TIANCHI新闻文本分类-Task1.赛题理解
赛题理解 赛题名称:零基础入门NLP之新闻文本分类 赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。 赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。 学习目标 理解赛题背景与赛题数据 完成赛题报名和数据下载,理解赛题的解题思路 赛题数据 赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房转载 2021-05-06 15:03:23 · 145 阅读 · 0 评论