python读网页解析内容写入文件

快速入门 http://developer.51cto.com/art/201207/347006.htm

注意编译指令有一处错误

python -O -m py_compile hello.py

工程发布

http://blog.csdn.net/u011465933/article/details/9567375


下面是相关代码

import sys
import urllib
import random
import time
def GetNowTime():
    return time.strftime("%Y-%m-%d %H:%M:%S",time.localtime(time.time()))
def GetDayTime():
    return time.strftime("%Y-%m-%d",time.localtime(time.time()))
def WriteFile(ip, dat):
	strCurTime = GetDayTime()
	output = open(strCurTime + "_" + ip, 'a+')
	output.writelines(dat)
	output.close()
def GetHtml(url):
	response=urllib.urlopen(url)
	html = response.read()
	return html
devIp = raw_input("ip: ") 
print devIp
baseUrl = 'http://' + devIp + '/goform/formIPQAM?type=3&cmd=1&language=1&gbeNo=0&ran='
while True:
	url = baseUrl + str(random.uniform(0, 1)) + '&rowIndex=0'
	html = GetHtml(url);
	arrTsk =  html.split('<*1*>')
	nIndx = len(arrTsk) - 1
	totalTskNum = 0
	if nIndx > 0:
		strTail = arrTsk[-1]
		strTail = strTail.split('<*2*>')
		strTail = strTail[-1]
		strTail = strTail.split('<')
		strTail = strTail[0]
		totalTskNum = int(strTail)
	WriteFile(devIp, "*****" + GetNowTime() + "****" + str(totalTskNum) + "********************\n")
	if nIndx > 0:
		WriteFile(devIp, html)
		while totalTskNum > nIndx:
			url = baseUrl + str(random.uniform(0, 1)) + '&rowIndex=' + str(nIndx)
			html = GetHtml(url)
			WriteFile(devIp, html)
			nIndx += 16
	print totalTskNum
	WriteFile(devIp, "*****end****************************************\n")
	time.sleep(3600)


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值