我的问题是,我有多个大小为200mb+的文本文件,使用这种格式(非常少的示例):john,smith,3;sasha,dilma,4;sofia,vergara,5;etc.
我需要阅读所有这些文件并分析信息、图表、总和等
我一直在考虑用不同的方法保存数据并在Python中使用它。但是,每当我尝试将数据加载到数据库中或直接在Python中(也尝试使用lineterminator参数)时,行终止符“;”都会导致问题,例如:
^{pr2}$
结果:# 3 first users:
name last_name number
0 john,smith,3 sasha,dilma,4 sofia,vergara,5
编辑。当我像这样实现lineterminator时:users = pd.read_table('C:/prueba.txt', engine='python', sep=',', lineterminator=';', header=None, names=userHeader)
我得到以下信息:---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
in ()
1 import pandas as pd
2 userHeader = ['user_id', 'gender', 'age']
----> 3 users = pd.read_