csv打乱顺序
import pandas as pd
from sklearn.utils import shuffle
def get_label_data():
data = pd.read_csv('文件的读取路径')
data = shuffle(data)
data['review'] = data['review'].str.replace('\n', '').replace(' ', '').replace('\t', '').replace('\r', '')
data.to_csv('文件的保存路径', index=False)
get_label_data()
csv文件比例分割可参考:csv分割。源代码直接执行可能会报错,大致是文本格式问题,改动方法,将所有open()里面都改成这个样子,就是加了一个encodeing='utf-8'
open(path, 'r', newline='', encoding='utf-8')