Python 3 爬虫之查询Github上哪些用户名没有被注册

本文讲述了作者使用Python 3编写爬虫,尝试从一份包含六千多个单词的文件中,逐个检查这些词汇是否已被注册为Github用户名。由于初期未采用多线程,爬虫每次请求后会暂停几秒以避免被Github限制访问。虽然最终并未实际使用这些用户名,但这次经历作为一个爬虫学习的实例。
摘要由CSDN通过智能技术生成

想换个又短又有内涵还没什么人用的ID,想了几个一直被注册。于是在百度文库找了一份六千多个单词的文件,用爬虫挨个上Gibhub试。

写的时候还不会多线程,单线程发一次请求就停几秒,否则很快被拒绝访问。还好不是封IP。

抓完又觉得这样起名没意思。就当一次爬虫练习吧。


#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Author: LostInNight
# @Date:   2015-10-27 13:26:45
# @Last Modified by:   LostInNight
# @Last Modified time: 2015-10-28 08:33:26
# 上Github查询指定用户名是否存在

import requests
import sys
import os
import time

# 设置当前目录为当前工作目录,便于读写
# os.chdir(sys.path[0])
os.chdir(r'F:\PythonWorkspace\Github-Rename')

def trans_time(sec):
    hour = int(sec / 3600)
    sec = sec % 3600
    minute = int(sec / 60)
    sec = sec % 60
    return "%s小时 %s分 %.2f秒" % (hour, minute, sec)

def get_html(url):
    try:
        time.sleep(3)
        print('正在访问网址... ', url)
        html = requests.get(url, headers=headers, timeout=10).text
    except Exception as
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值