自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 零基础入门NLP组队学习-Task4(基于深度学习的文本分类1)

## NLP组队学习Day6-7 目录 目标 文本表示方法 Part2 FastText 基于机器学习的文本分类 目标 学习FastText的使用和基础原理 学会使用验证集进行调参 文本表示方法Part2 上一篇博客介绍了几种文本表示方法: One-hot Bag of Words N-gram TF-IDF 也通过sklean进行了相应的实践,相信你也有了初步的认知。但上述方法都或多或少存在一定的问题:转换得到的向量维度很高,需要较长的训练实践;没有考虑单词与单词之间的关系,只是进行了统计

2020-07-27 22:24:32 84 1

原创 零基础入门NLP组队学习-Task3(文本分类)

NLP组队学习Day3-5 目录 目标 机器学习模型 文本表示方法 ont-hot Bag of Words 基于机器学习的文本分类 目标 学会TF-IDF的原理和使用 使用sklearn的机器学习模型完成文本分类 机器学习模型 机器学习是对能通过经验自动改进的计算机算法的研究。机器学习通过历史数据训练出模型对应于人类对经验进行归纳的过程,机器学习利用模型对新数据进行预测对应于人类利用总结的规律对新问题进行预测的过程。 机器学习有很多种分支,对于学习者来说应该优先掌握机器学习算法

2020-07-25 17:34:58 126

原创 零基础入门NLP组队学习-Task2(赛题读取与分析)

NLP组队学习Day2 目录 数据读取 数据分析 -句子长度分析 -新闻类别分布 -字符分布统计 -数据分析结论 本章作业 数据读取 昨天按照自己的方法读了一遍,今天根据官方的方法读了一遍。 数据分析 1.句子长度分析 2.新闻类别分布 在数据集中标签的对应的关系如下:{‘科技’: 0, ‘股票’: 1, ‘体育’: 2, ‘娱乐’: 3, ‘时政’: 4, ‘社会’: 5, ‘教育’: 6, ‘财经’: 7, ‘家居’: 8, ‘游戏’: 9, ‘房产’: 10, ‘时尚’:

2020-07-22 22:34:44 138

原创 零基础入门NLP组队学习-Task1(赛题理解)

零基础入门NLP组队学习-Task1(赛题理解) 目录 赛题理解 学习目标 赛题数据 数据标签 评测指标 数据读取 解题思路 赛题理解 赛题名称:零基础入门NLP之新闻文本分类 赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。 赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。 学习目标 理解赛题背景与赛题数据 完成赛题报名和数据下载,理解赛题的解题思路 赛题数据 赛题以匿名处理后的新闻数据为赛题数

2020-07-21 22:42:06 99

原创 西瓜书 第三章 线性模型 部分公式推导

由于输入太多公式太麻烦,所以懒惰的我选择上传图片! 1-2张图是一元线性回归的部分公式推导;3-4张图是多元线性回归的部分公式推导;5-6张是对数几率回归的不分公式推导。其中可能包含了一些所必要的数学知识。 说明:推导内容并非我的原创,是参考某课程后的输出。 ...

2020-04-08 22:15:58 421 1

原创 西瓜书----初识机器学习

西瓜书是我学习机器学习的入门书,之前看过一遍,但是感觉很多地方囫囵吞枣,现在打算再仔仔细细学一遍,同时分享自己的心得笔记,希望也可以帮到一些小白。 这篇文章主要是大体介绍一下机器学习,对机器学习有的大概的印象。 一、目前机器学习中比较活跃的四大应用领域: 数据挖掘:发现数据之间的关系 计算机视觉:让计算机能够像人一样看懂世界 自然语言处理:让计算机能够像人一样看懂文字 机器人决策:让计算机能够像...

2020-03-29 09:19:28 166

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除