![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP学习
结实
这个作者很懒,什么都没留下…
展开
-
NLP学习task2
Q1:假设字符3750,字符900和字符648是句子的标点符号,请分析赛题每篇新闻平均由多少个句子构成?根据学习笔记,代码修改如下:from collections import Counterall_lines = ' '.join(list(train_df['text']))word_count = Counter(all_lines.split(" ")) #返回的是键值对,字符以及与之对应的个数。word_count = sorted(word_count.items(), key=原创 2020-07-24 14:56:47 · 123 阅读 · 0 评论 -
NLP学习打卡task1-datawhale
@NLP学习打卡task1-datawhale赛题名称:零基础入门NLP之新闻文本分类赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。赛题概览赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。赛题数据由以下几个部分构成原创 2020-07-21 20:14:44 · 152 阅读 · 0 评论