python爬虫抓手机号+java客户端小程序

介绍

前几天做了个抓手机号的爬虫,这两天没啥事就学了学java swing,然后想着给蛇画俩腿,额 是给那个小程序做个界面。

大概组件怎么用,布局怎么用,照着书上学了个大概,就迫不急待的动手了,今天终于做成了。记录一下过程,以后要是忘记,可以回来看看。

成品图:

从python开始

那么就从python爬虫开始吧。毕竟python一共也没学多长时间,记录一下,以后忘了还能来看看。

我安的2.7版本python,安装很简单一路下一步就安好了,环境变量配置留个备份。

然后下了个社区版的PyCharm,就可以正式开始了。

这就写好了,pages决定抓这个网站几页的手机号。

# coding: UTF-8
import re
import requests

def write(page):
    r = requests.get("http://www.0597zp.com/more.php?page="+str(page))
    result = re.findall('target=_blank>(.*?)</A>',r.content)
    if(len(result)>0):
        tempfile = open("mobile.txt",'a')
        for i in result:
            print (i + ";")
            tempfile.write(i + ";")
        tempfile.write("\n")
        tempfile.close()
pages=10
for i in range(0,pages+1):
    write(i)

requests是需要安装的,打开cmd,命令:pip install requests,就ok了,要是pip用不了那就是python环境变量没搭好。

这几行代码没啥好说的,requests用法网上就有,正则挺麻烦的,好在原来看过个视频讲过这个贪心算法(.*?)挺好使的。暂且先用着把,等我以后成长到适当水平在来研究它,现在需要学的东西多着呢,就不跟它耗着了。

这个网站每页100条,抓了10页的数据:

嗯 这个小程序就写好了,下篇写java界面吧。我总怕看太长的文章,所以就这样结束把。




  • 2
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 11
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值