![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言
极客阿宝
这个作者很懒,什么都没留下…
展开
-
Task6 基于深度学习的文本分类3-BERT
import logging import random import numpy as np import torch logging.basicConfig(level=logging.INFO, format='%(asctime)-15s %(levelname)s: %(message)s') # set seed seed = 666 random.seed(seed) np.random.seed(seed) torch.cuda.manual_seed(seed) torch.manu原创 2020-08-04 23:12:37 · 379 阅读 · 0 评论 -
Task04:基于深度学习的文本分类1
FastText FastText是一种典型的深度学习词向量的表示方法,它非常简单通过Embedding层将单词映射到稠密空间,然后将句子中所有的单词在Embedding空间中进行平均,进而完成分类操作。 所以FastText是一个三层的神经网络,输入层、隐含层和输出层。 下图是使用keras实现的FastText网络结构: FastText在文本分类任务上,是优于TF-IDF的: FastText用单词的Embedding叠加获得的文档向量,将相似的句子分为一类 FastText学习到的Embeddi原创 2020-07-27 23:11:31 · 96 阅读 · 0 评论 -
Task3 基于机器学习的文本分类
正在学习中原创 2020-07-27 22:44:24 · 90 阅读 · 0 评论 -
NLP-数据读取与数据分析
数据读取与数据分析 使用Pandas库完成数据读取操作 import pandas as pd train_df = pd.read_csv('../input/train_set.csv', sep='\t', nrows=100) 此处的read_csv由三部分构成: 读取的文件路径,这里需要根据改成你本地的路径,可以使用相对路径或绝对路径; 分隔符sep,为每列分割的字符,设置为\t即可; 读取行数nrows,为此次读取文件的函数,是数值类型(由于数据集比较大,建议先设置为100);原创 2020-07-22 23:24:41 · 376 阅读 · 0 评论 -
Java语言概述
本章将会对新闻文本分类进行赛题讲解,对赛题数据进行说明,并给出解题思路。 一.赛题理解 赛题名称:零基础入门NLP之新闻文本分类 赛题链接:https://tianchi.aliyun.com/competition/entrance/531810/introduction 二.学习目标 赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。 赛题数据由以下几个部分构成: 训练集20w条样本原创 2020-07-21 22:56:48 · 152 阅读 · 0 评论