自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Task4 基于深度学习的文本分类1-fastText

这里写目录标题一级目录二级目录三级目录与传统机器学习不同,深度学习既提供特征提取功能,也可以完成分类的功能。从本章开始我们将学习如何使用深度学习来完成文本表示。现有文本表示方法的缺陷:One-hotBag of WordsN-gramTF-IDF也通过sklean进行了相应的实践,相信你也有了初步的认知。但上述方法都或多或少存在一定的问题:转换得到的向量维度很高,需要较长的训练实践;没有考虑单词与单词之间的关系,只是进行了统计。与这些表示方法不同,深度学习也可以用于文本表示,还可以将其映射到

2020-07-28 23:56:00 97

原创 Datawhale零基础入门NLP-Task01-day3

Datawhale零基础入门NLP-Task01-day 3TF-IDF + RidgeClassifier一. 基础知识:文本表示方法 Part1**One-hot****Bag of Words****N-gram****TF-IDF**二. 具体步骤1. 事例2. 实操a. 读取,合并数据:`concat:``append:`b. TF-IDFc. TF-IDF和ngram进行gridsearchd. 分类器RidgeClassifier(岭回归分类器)LinearSVC引用学习资料:https:

2020-07-25 06:24:07 271

原创 Datawhale零基础入门NLP-Task01-day2

数据读取与数据分析数据读取与数据分析一. 数据读取二. 数据分析句子长度分析新闻类别分布字符分布统计数据分析的结论**本章小结**本文主要资源引用:https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.9.6406111aIKCSLV&postId=118253本章主要内容为数据读取和数据分析,具体使用Pandas库完成数据读取操作,并对赛题数据进行分析构成。数据读取与数据分析赛题数据虽然是文本数据,

2020-07-22 23:14:19 238

原创 Datawhale零基础入门NLP-Task01-day 1

Datawhale零基础入门NLP-Task01-day 1一、赛题数据赛题理解赛题数据二、评测标准解题思路一、赛题数据摘要:本章将会对新闻文本分类进行赛题讲解,对赛题数据进行说明,并给出解题思路。本文结构和框架大部分参考自:https://tianchi.aliyun.com/competition/entrance/531810/informationhttps://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.6.6

2020-07-21 22:06:41 108

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除