流程:模拟登录→获取html页面→正则解析所有符合条件的行→逐一将符合条件的行的所有列存入到csvdata[]临时变量中→写入到csv文件中
核心代码:
####写入csv文件中
with open(self.csvfilename, 'wb') as csvfile:
spamwriter = csv.writer(csvfile, dialect='excel')
#设置标题
spamwriter.writerow(["游戏账号","用户类型","游戏名称","渠道","充值类型","充值金额","返利金额","单号","日期"])
#将csvdata中的数据循环写入到csvfilename文件中
for item in self.csvdata:
spamwriter.writerow(item)
完整代码:
# coding=utf-8
import urllib
import urllib2
import cookielib
import re
import csv
import sys
class pyw():
#初始化数据
def __init__(self):
#登录的url地址
self.loginurl="http://v.pyw.cn/login/check"
#所要获取的url地址
self.pageurl="http://v.pyw.cn/data/accountdeta