自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 2021-04-28

ssm:mybatis + Spring + SpringMVC MVC三层架构JavaSE:认真学习,老师带,入门快JavaWeb:认真学习,老师带,入门快SSM框架:研究官方文档,锻炼自学能力,锻炼笔记能力,锻炼项目能力SpringMVC + Vue + SpringBoot + SpringCloud + LinuxSSM = JavaWeb做项目Spring: IOC 和 AOPSpringMVC:SpringMVC的执行流程SpringMVC:SSM框架整合什么是MVCMVC

2021-04-28 16:47:18 297

原创 Task6 基于深度学习的文本分类3-BERT

BERT微调将最后一层的第一个token即[CLS]的隐藏向量作为句子的表示,然后输入到softmax层进行分类。预训练BERT以及相关代码下载地址:链接: https://pan.baidu.com/s/1zd6wN7elGgp1NyuzYKpvGQ 提取码: tmp5import loggingimport randomimport numpy as npimport torchlogging.basicConfig(level=logging.INFO, format='%(asct

2020-08-04 23:51:12 149

原创 Task4 - Word2Vec

学习目标学习Word2Vec的使用和基础原理学习使用TextCNN、TextRNN进行文本表示学习使用HAN网络结构完成文本分类文本表示方法Word2Vec-Skip-Gram实现1. 读取数据、建立语料字典from collections import Counter,dequeimport randomimport tensorflow as tf import mathimport pandas as pdimport numpy as np import gct

2020-07-31 22:55:30 152

原创 Task4 - fastText入门到实战(一篇就够)

前言One-hotBag of WordsN-gramTF-IDF都存在一定的问题:转换得到的向量维度很高,需要较长的训练实践;没有考虑单词与单词之间的关系,只是进行了统计。与这些表示方法不同,深度学习也可以用于文本表示,还可以将其映射到一个低纬空间。其中比较典型的例子有:FastText、Word2Vec和Bert。在本章我们将介绍FastText。FastText入门篇定义FastText是一种典型的深度学习词向量的表示方法,它非常简单通过Embedding层将单词映射到稠密空间,

2020-07-27 16:57:50 298

原创 已解决ERROR: Failed building wheel for fasttext

前言网上搜刮一波,发现乱七八糟,什么东东都叫你下载,下完还是没用。自己捣鼓一个多钟,发现就两步解决这个问题。错误代码如下 Building wheel for fasttext (setup.py) ... error ERROR: Command errored out with exit status 1: command: 'D:\software\Anaconda3\python.exe' -u -c 'import sys, setuptools, tokenize; sys.a

2020-07-25 23:42:58 7791 12

原创 零基础入门NLP赛事 - Task3 基于机器学习的文本分类

学习目标学会常用的文本表示方法原理和使用使用sklearn的机器学习模型完成文本分类文本表示方法在机器学习算法的训练过程中,假设给定N个样本,每个样本有 M 个特征,这样组成了 N×M 的样本矩阵,然后完成算法的训练和预测。同样的在计算机视觉中可以将图片的像素看作特征,每张图片看作hight×width×3的特征图,一个三维的矩阵来进入计算机进行计算。但是在自然语言领域,上述方法却不可行:文本是不定长度的。文本表示成计算机能够运算的数字或向量的方法一般称为词嵌入(Word Embedding

2020-07-23 15:17:06 151

原创 零基础入门NLP赛事 - Task2 数据读取与数据分析

学习目标学习使用Pandas读取赛题数据分析赛题数据的分布规律数据读取import pandas as pd#先读取100行data=pd.read_csv('train_set.csv', sep='\t', nrows=100)#设置value的显示长度为100,默认为50pd.set_option('max_colwidth',100)train_data.head().append(train_data.tail())数据分析此步骤我们读取了所有的训练集数据,在此我们

2020-07-22 09:39:17 129

原创 零基础入门NLP赛事 - Task1 赛题理解

零基础入门NLP赛事 - Task1 赛题理解前言第一次参加比赛,请多多指教!赛题理解赛题名称:零基础入门NLP之新闻文本分类赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。赛题数据赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、

2020-07-21 13:18:21 159

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除