![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
世界而世界
这个作者很懒,什么都没留下…
展开
-
【NLP入门】赛题1-新闻文本分类-Task5-基于深度学习的文本分类2-1Word2Vec
赛题1-新闻文本分类-Task5-基于深度学习的文本分类2-1Word2Vec 本次任务四天完成 赛题 赛题讲解 赛题 数据讲解 机器学习讲解 深度学习-fastText 深度学习-word2vec 安装 pyTorch 官网 下载地址及安装说明 跑程序 先导入包 import logging import random import numpy as np import torch logging.basicConfig(level=logging.INFO, format='%(asct原创 2020-07-31 13:33:13 · 563 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task04-基于深度学习的文本分类1-fastText
赛题1-新闻文本分类-Task04-基于深度学习的文本分类1-fastText 本次任务两天完成 赛题 赛题讲解 赛题 数据讲解 机器学习讲解 深度学习-fastText 目标 学习FastText的使用和基础原理 学会使用验证集进行调参 跑fasttext模型代码 数据预处理 # 引入 Pandas import pandas as pd # 读取数据 train_set = pd.read_csv('./data/1/train_set.csv', sep='\t', nrows=15000原创 2020-07-27 21:58:25 · 314 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task03-基于机器学习的文本分类
赛题1-新闻文本分类-Task03-基于机器学习的文本分类 本次任务三天完成 赛题 赛题讲解 赛题 数据讲解 机器学习讲解 使用机器学习跑模型试试 读取数据 # 引入 Pandas import pandas as pd # 读取数据 train_set = pd.read_csv('./data/1/train_set.csv', sep='\t') # 看一下数据的前几行 train_set.head() 基于机器学习的文本分类 # Count Vectors + RidgeClassi原创 2020-07-25 21:58:05 · 227 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task02-数据读取及初步分析
赛题1-新闻文本分类-Task02-数据读取及初步分析 今天主要是代码向 # 引入 Pandas import pandas as pd # 读取数据 train_set = pd.read_csv('./data/1/train_set.csv', sep='\t') # 看一下数据的前几行 train_set.head() # 数据分析 # 1 赛题数据中,新闻文本的长度是多少? # 2 赛题数据的类别分布是怎么样的,哪些类别比较多? # 3 赛题数据中,字符分布是怎么样的? # 句子长度分析 t原创 2020-07-22 23:39:51 · 203 阅读 · 0 评论 -
【NLP入门】赛题1-新闻文本分类-Task01-赛题理解
赛题1-新闻文本分类-Task01-赛题理解 赛题 赛题讲解 赛题 环境安装 下载 anaconda 地址 现在官网就可以直接下载了 目前我装的是 py3.7 装好之后可以使用 jupyter 进行可视化开发 1 读取数据 # 引入 Pandas import pandas as pd # 读取数据 # 数据分隔符 \t # \t 水平制表(HT) (跳到下一个TAB位置) train_set = pd.read_csv('./data/1/train_set.csv', sep='\t')原创 2020-07-21 23:22:52 · 251 阅读 · 0 评论