NLP组队打卡
杰杰哒来了
上海某高校研一在读,研究方向为数据科学与统计计算,初入机器学习大门,打算用CSDN记录自己的蜕变历程嘻嘻嘻。
展开
-
零基础入门NLP组队学习-Task4(基于深度学习的文本分类1)
## NLP组队学习Day6-7目录目标文本表示方法 Part2FastText基于机器学习的文本分类目标学习FastText的使用和基础原理学会使用验证集进行调参文本表示方法Part2上一篇博客介绍了几种文本表示方法:One-hotBag of WordsN-gramTF-IDF也通过sklean进行了相应的实践,相信你也有了初步的认知。但上述方法都或多或少存在一定的问题:转换得到的向量维度很高,需要较长的训练实践;没有考虑单词与单词之间的关系,只是进行了统计原创 2020-07-27 22:24:32 · 91 阅读 · 1 评论 -
零基础入门NLP组队学习-Task3(文本分类)
NLP组队学习Day3-5目录目标机器学习模型文本表示方法ont-hotBag of Words基于机器学习的文本分类目标学会TF-IDF的原理和使用使用sklearn的机器学习模型完成文本分类机器学习模型机器学习是对能通过经验自动改进的计算机算法的研究。机器学习通过历史数据训练出模型对应于人类对经验进行归纳的过程,机器学习利用模型对新数据进行预测对应于人类利用总结的规律对新问题进行预测的过程。机器学习有很多种分支,对于学习者来说应该优先掌握机器学习算法原创 2020-07-25 17:34:58 · 133 阅读 · 0 评论 -
零基础入门NLP组队学习-Task2(赛题读取与分析)
NLP组队学习Day2目录数据读取数据分析-句子长度分析 -新闻类别分布-字符分布统计-数据分析结论本章作业数据读取昨天按照自己的方法读了一遍,今天根据官方的方法读了一遍。数据分析1.句子长度分析2.新闻类别分布在数据集中标签的对应的关系如下:{‘科技’: 0, ‘股票’: 1, ‘体育’: 2, ‘娱乐’: 3, ‘时政’: 4, ‘社会’: 5, ‘教育’: 6, ‘财经’: 7, ‘家居’: 8, ‘游戏’: 9, ‘房产’: 10, ‘时尚’:原创 2020-07-22 22:34:44 · 144 阅读 · 0 评论 -
零基础入门NLP组队学习-Task1(赛题理解)
零基础入门NLP组队学习-Task1(赛题理解)目录赛题理解学习目标赛题数据数据标签评测指标数据读取解题思路赛题理解赛题名称:零基础入门NLP之新闻文本分类赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。学习目标理解赛题背景与赛题数据完成赛题报名和数据下载,理解赛题的解题思路赛题数据赛题以匿名处理后的新闻数据为赛题数原创 2020-07-21 22:42:06 · 107 阅读 · 0 评论