![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
WBwhiteBeard
认真
展开
-
记一次使用 Pandas.DataFrame.sample
首先我的目标是将一个.csv文件中的内容给分割开来。 分为训练集与测试集。但是折腾了一天,才发现有更加简单的方法实现。 使用pandas包。 train.to_csv('the_train.csv', encoding='utf_8_sig', sep='\t', header=None) # 测试集 test = train.sample(frac=0.1, replace=False, random_state=5, axis=0) # 训练集,余下的数据作为训练集 train = tra原创 2020-11-24 19:52:46 · 301 阅读 · 0 评论 -
Pandas.DataFrame.sample学习
参考资料: pandas.DataFrame.sample - pandas 0.23.1 documentationpandas.pydata.org 转载自:https://zhuanlan.zhihu.com/p/38255793 DataFrame.sample(n=None,frac=None,replace=False,weights=None,random_state=None,axis=None) 从一列/行数据里返回指定数量的随机样本。 常用的几个参数解释: n: ...转载 2020-11-24 19:45:43 · 451 阅读 · 0 评论 -
pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string starting at line 512
代码片段: import pandas as pd import csv Chinese_stop_words = pd.read_csv("./stop_words.txt", sep='\t', header=None, quoting=csv.QUOTE_NONE, encoding='utf-8') print(Chinese_stop_words) 解决办法: 出现这种错误:加上import csv,再加上 quoting=csv.QUOTE_NONE 结果: ...原创 2020-07-20 15:20:34 · 2299 阅读 · 0 评论