有时对于爬虫得到的数据,需要对其进行整理,一是为了格式统一,二是用excel表格也可以打开。再就是把得到的数据放入数据库都是需要的。
首先来看导成csv:
我认为最重要的一点是,如何把文本数据取出来放入类似二维数组的字符串组来保存。关键就在于如何取。
可以观察到这些数据以此的顺序,因此:
with open('info.txt','r') as file:
while True:
line=file.readline()
if line=='':
break
if len(line.split('\r')[0])==1:
continue
print len(line.split('\n')[0])
info.append(line.split('\n')[0])
# /r 和 /n 的区别?
count=0
for i in info:
print "测试&#