文章目录
大数据情况,R建议用fread(),或者用python
数据情况
维数:52225*6435;大小:711022kb
rawdata.shape
(52225, 6435)
用R的read.csv读取数据,并对y进行分组
结果和期望不同
rawdata <- read.csv(file=filename,header=TRUE,encoding='UTF-8')
用R的fread()读取数据,并对y进行分组
library(data.table)
data <- fread(file=filename,encoding='UTF-8')
用python的read_csv读取数据,并对y进行分组
import pandas as pd
rawdata = pd.read_csv('.//data.csv',encoding='utf-8',sep=',')