想换个又短又有内涵还没什么人用的ID,想了几个一直被注册。于是在百度文库找了一份六千多个单词的文件,用爬虫挨个上Gibhub试。
写的时候还不会多线程,单线程发一次请求就停几秒,否则很快被拒绝访问。还好不是封IP。
抓完又觉得这样起名没意思。就当一次爬虫练习吧。
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Author: LostInNight
# @Date: 2015-10-27 13:26:45
# @Last Modified by: LostInNight
# @Last Modified time: 2015-10-28 08:33:26
# 上Github查询指定用户名是否存在
import requests
import sys
import os
import time
# 设置当前目录为当前工作目录,便于读写
# os.chdir(sys.path[0])
os.chdir(r'F:\PythonWorkspace\Github-Rename')
def trans_time(sec):
hour = int(sec / 3600)
sec = sec % 3600
minute = int(sec / 60)
sec = sec % 60
return "%s小时 %s分 %.2f秒" % (hour, minute, sec)
def get_html(url):
try:
time.sleep(3)
print('正在访问网址... ', url)
html = requests.get(url, headers=headers, timeout=10).text
except Exception as