- 博客(5)
- 收藏
- 关注
原创 Pandas读取文件踩坑(2)
Pandas读取文件报错如下:Error tokenizing data. C error: Buffer overflow caught - possible malformed input file.查阅资料得知是由于csv文件中存在\n设置 lineterminator='\n' ,问题解决...
2019-05-13 00:22:09 322
原创 电信用户匹配模型实例
如下: import numpy as npimport pandas as pdimport jieba.analyse as jieba data = pd.read_csv(r'/opt/dianxing/train_all.csv',low_memory=False)def dataProcess(data):data.is_mix_service=data...
2019-01-27 11:22:18 872
原创 pandas读取文件踩坑(1)
查阅资料发现是文件中存在linux无法读取的字符’\r’即换行符加入参数lineterminator='\n',报错如下加入参数error_bad_lines=False报错如下Windows查看猜测是文件格式的问题,在windows 系统中editplus查看乱码,转换文件格式xlsx,用pandas读取文件,解决。过程如下(此处ipython)Pan...
2018-10-31 21:50:06 1527
原创 linux登录界面 停留
刚才启动的时候发现界面一直停留在登录界面,然后查阅资料得知可能是环境变量的原因然后ctrl+alt+f3,输入用户和密码进入字符界面,修改环境变量。惊喜地发现一堆指令无法使用,包括vi,应该也是环境变量的问题正常情况下能使用vi是因为PATH中包含了vi的路径,此时直接输入PATH=/bin:/usr/bin将路径写入profile 、然后用vi指令修改profile文件并重启...
2018-10-24 00:56:57 1973
原创 hadoop运行 jar包
问题描述:hadoop运行jar包时一直显示路径不存在,经调整路径后再次运行jar包,显示文件不存在。原因:由于core-site.xml事先配置过路径的原因,会先读取hdfs文件系统上的文件,导致出现文件不存在的错误,删除core-site.xml中的有关配置得以解决...
2018-10-24 00:49:55 1531
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人