阿里天池文本分类竞赛task2:初始数据分析

在这一块当中我们稍微看看就好,不需要了解得太详细。进行文本数据分析往往是一个数据科学家需要具有的良好习惯,因为在对数据分析之前,需要对数据具有初步的了结。

首先我们导入代码,开始分析数据:

import pandas as pd
train_df = pd.read_csv('train_set.csv', sep='\t')

这样我们就将csv文件变成了dataframe,就可以根据开始做各种各样的数据分析了。

现在我们先来看看数据长什么样:

 

 

 

 然后查看各个文本分类的数量如何,代码和可视化后的状态如下:

 

 的解。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值