github的仓库是可以统计每个贡献者的代码行数的,公司年会的时候,特设了一个“码神奖”,颁给去年贡献代码最多的工程师,github的统计数据显示,这位大神去年提交的代码达到了110w行,这个数据太惊人了,一个人不可能写这么多代码的,我非常好奇的研究了一下,发现中间还包括了他提交的很多第三方库,但github也一并统计了,而且经过他合并的代码也会统计进去。那么有没有办法去掉这些无效数据,得到真实的代码贡献量呢?查了一下github api,再结合git 命令,还是可以的,上代码:
#copy this script to your target repo
#run python github-stats.py to collect data
import re
import json
import os
import sys
import requests
#get token from cmd line
tk = sys.argv[1]
user_stats={"dummy":{"additions":0,"deletions":0,"total":0}}
#query github api for last year's commits
payload = {'since':'2013-01-01T00:00:00Z','until':'2014-01-01T00:00:00Z','access_token':tk}
token = {'ac