python3--实战项目--读取自建github网站上项目名称、git地址、新建/切换/清空项目文件夹、git clone到目标项目文件夹

python3–实战项目–读取自建github网站上项目名称、git地址、新建/切换/清空项目文件夹、git clone到目标项目文件夹

1、项目背景
需要对自建的github网站上特定项目(TB_字母开头的)代码进行git clone到源代码审计服务器上。由于以TB_*开头的项目有202个,使用python脚本处理
目标网站:https://git.xxxxxxx.com/?non_archived=true&page=1&sort=latest_activity_desc
处理思路:对目标网站的网页总共有16页
目标1/2/3/4/…网页----获取登录网页cookie信息—爬取整个网页内容—提取出项目名称–对项目名称特殊格式处理(后面在服服务器上的项目名称)—对TB_*某一项目URL地址打开–提取出该项目的git@git…URL地址—在服务器组装项目存储绝对地址—新建每个项目地址—自动切换到每个项目中—在每个自己项目进行清空目录,然后git clone代码—再切换到总项目根目录下

2、项目代码:

# -*- coding: utf-8 -*-
"""
Created on Fri Apr 26 15:36:10 2019

@author: fern.xu
"""
import requests
import os
import time
import re
import bs4
from bs4 import BeautifulSoup
from urllib.request import urlretrieve
from pathlib import Path
import html5lib
import urllib3

def main():
    for num in range(1,16):#遍历16个网页
        #组装访问的目标地址
        url = 'https://git.wolaidai.com/?non_archived=true&page='+str(num)+'&sort=latest_activity_desc'
        fun(url)

def fun(url):
    urllib3.disable_warnings()#ssl认证告警信息屏蔽
    tb_list = []#存放TB项目名称
    tb_name_url = []#项目的绝对路径
    tbgit_list = []#存在项目的git地址
    tb_dict = {}#使用项目的绝对路径与项目的git地址组合
    #手动提取cookie保存为txt
    f=op
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

徐为波

看着给就好了,学习写作有点累!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值