NPL基础入门之新闻本分类数据分析Test2

NPL基础入门之新闻本分类数据分析Test2数据读取数据分析标签分布(基matplitlit画图与Seabron对比)新闻内容长度分析数据读取因电脑内存限制无法一次性读取整个训练集,所以在暂时读取了50000条样本数据。data = pd.read_csv(r'C:\Users\pc\Desktop\数据挖掘\阿里天池\新闻文本分析\input\train_set.csv',sep='\t',nrows=50000)个人总结:当内存不足时可通过调整read_csv()参数调整:1、读取限定前行数
摘要由CSDN通过智能技术生成

数据读取

因电脑内存限制无法一次性读取整个训练集,所以在暂时读取了50000条样本数据。

data = pd.read_csv(r'C:\Users\pc\Desktop\数据挖掘\阿里天池\新闻文本分析\input\train_set.csv',sep='\t',nrows=50000)

个人总结:当内存不足时可通过调整read_csv()参数调整:
1、读取限定前行数:nrow = x
2、读取限定列: usecols=[‘column1’, ‘column2’, ‘column3’]
3、分块迭代读取:chunksize=1000

readers = pd.read_csv('demo.csv',nrows=10000,usecols=['column1','column2','column3'
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值