![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
点西西
新手渣渣的学习笔记,望各路大神多多指点。
展开
-
TiANCHi新闻文本分类代码解读
Task 2 数据读取和数据分析 import pandas as pd train_df = pd.read_csv(r"E:\tianchi\input\train_set.csv\train_set.csv", sep='\t', nrows=100) 1、读取的路径 2、分隔符sep。每列的分割字符。设置为’\t’即可 3、nrows。表示读取的行数。这里表示先读取100行。正式训练时去掉即可。 train_df.head() 显示前5行数据 %pylab inline #获取每行句子的长度。原创 2020-07-25 13:23:13 · 376 阅读 · 1 评论 -
NLP文本分类问题-电影评论的情感分析
预训练词嵌入 数据集是kaggle上的竞赛数据 文本分类问题-电影评论的情感分析。 https://www.kaggle.com/columbine/imdb-dataset-sentiment-analysis-in-csv-format。 从头开始学习嵌入 import pandas as pd import numpy as np #读取csv文件 train = pd.read_csv('/kaggle/input/imdb-dataset-sentiment-analysis-in-csv-.原创 2020-07-28 16:54:29 · 2313 阅读 · 0 评论