- 博客(5)
- 收藏
- 关注
原创 Task05
import loggingimport randomimport numpy as npimport torchlogging.basicConfig(level=logging.INFO, format='%(asctime)-15s %(levelname)s: %(message)s')# set seed seed = 666random.seed(seed)np.random.seed(seed)torch.cuda.manual_seed(seed)torch.manua
2020-08-01 11:06:23
92
1
原创 基于深度学习的文本分类
在上一章节,我们使用传统机器学习算法来解决了文本分类问题,从本章开始我们将尝试使用深度学习方法。Task4 基于深度学习的文本分类1-fastText与传统机器学习不同,深度学习既提供特征提取功能,也可以完成分类的功能。从本章开始我们将学习如何使用深度学习来完成文本表示。学习目标学习FastText的使用和基础原理学会使用验证集进行调参文本表示方法 Part2现有文本表示方法的缺陷在上一章节,我们介绍几种文本表示方法:One-hotBag of WordsN-gramTF-IDF也
2020-07-28 09:02:31
221
原创 读取数据
学习目标¶学习使用Pandas读取赛题数据分析赛题数据的分布规律数据读取¶赛题数据虽然是文本数据,每个新闻是不定长的,但任然使用csv格式进行存储。因此可以直接用Pandas完成数据读取的操作。[1]:2 1import pandas as pd2train_df = pd.read_csv(’…/data/train_set.csv’, sep=’\t’, nrows=100)这里的read_csv由三部分构成:这里的read_csv由三部分构成:读取的文件路径,这里需要根据改成你本地的路径,可
2020-07-26 10:19:01
181
原创 数据读取与数据分析
Task2 数据读取与数据分析数据读取赛题数据虽然是文本数据,每个新闻是不定长的,但任然使用csv格式进行存储。因此可以直接用Pandas完成数据读取的操作。1、import pandas as pd2、train_df = pd.read_csv('../data/train_set.csv', sep='\t', nrows=100)这里的read_csv由三部分构成:读取的文件路径,这里需要根据改成你本地的路径,可以使用相对路径或绝对路径;分隔符sep,为每列分割的字符,设置为\
2020-07-23 08:51:02
290
原创 NLP初识
学习的第一天赛题理解赛题名称:零基础入门NLP之新闻文本分类赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。学习目标理解赛题背景与赛题数据完成赛题报名和数据下载,理解赛题的解题思路赛题数据选取类别:科技类处理后的数据是数字类型的字符串。测试集的数据量在5w条左右。在数据集中标签的对应的关系如下:{‘科技’: 0, ‘股票’:
2020-07-21 21:10:49
78
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人