Python备份CSDN博客

使用Python实现的功能,将指定用户的CSDN博客备份为HTML格式,存放在当前目录的用户文件夹中。目前尚未开启多线程,存在反盗链处理问题,以及文件名优化等待改进。感谢技术交流群里的帮助,已了解join用法,资源分享经历了一些波折。
摘要由CSDN通过智能技术生成

用Python实现备份CSDN博客:

功能:备份输入user的所有博文到当前目录下的user文件夹内(html格式)

不足:暂时还没开多线程,并且反盗链之类还没有处理(虽然转载的文章一般都是保存没反盗链的图,但是,还是一个不足),然后就是语言的精简还需提高,比如文件名修正,应该可以用循环匹配查找…………

谢谢python技术交流群里的菜鱼和xiao等前辈的指导,编码问题给我郁闷了好久,欢迎大家拍砖。

————————

添加多线程,知道join了,呵呵

转为的exe版本见0分下载页http://download.csdn.net/detail/betabin/4377512

————————

上面的exe资源被Csdn删掉了,这能接受,可是连事后通知都没有,这有点………

貌似又恢复了……这…………

————————

把文件名的过滤用sub替代,减去冗余代码

会python的就自己脚本跑吧。

# -*- coding: cp936 -*-
'''
Author: BetaBin
Date: 2012/06/16
Function: Backup the csdn blog.
'''
import urllib
import urllib2
import os
import re
import traceback
import threading
import datetime

#Global data
#日志链接,相对路径:日志名
blogurl = {}
savednum = 1
threadnum = 5
bloghost = 'http://blog.csdn.net'
bloguser = 'BetaBin'

#获取infourl的html源码utf8编码
def getinfo(infourl, hostsite = ''):
    postdata = urllib.urlencode({})
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'
        }
    if hostsite != '':
        print &
### 回答1: 想要在Python中更改使用CSDN源,我们可以通过更改Python的源配置文件来实现。 首先打开Python安装目录下的Lib文件夹,找到site-packages文件夹,然后进入该文件夹。 在site-packages文件夹下找到一个名为pip-xx.x.dist-info(xx.x为当前pip版本号)的文件夹,进入该文件夹。 在该文件夹中找到一个名为entry_points.txt的文件,用文本编辑器打开该文件。 在entry_points.txt文件中找到[console_scripts]的部分。这个部分定义了一些命令行脚本。 在这部分中找到"pip=pip:_main"的这一行,将其修改为"pip=pip:main"。 保存文件后,关闭文本编辑器。 接下来,我们需要找到pip的配置文件pip.ini或者pip.conf。这个文件可能位于用户目录下的.pip目录中,也可能位于Python安装目录下的Lib文件夹中。 打开该文件,如果没有则新建一个。 在配置文件中加入以下内容: [global] index-url = https://pypi.tuna.tsinghua.edu.cn/simple 保存配置文件后,即可完成将Python的源更改为CSDN源。 通过这个方式,我们可以将Python使用的pip库的源配置为CSDN源,从而加快库的下载速度,提高开发效率。 ### 回答2: Python 是一种流行的编程语言,常用于数据分析、人工智能、Web开发等领域。而 CSDN 是一个知识分享平台,提供了众多的技术文章和开发资源。如果想要将 Python 源更换为 CSDN 源,可以按照以下步骤进行。 首先,打开 Python 的安装目录,找到 "Lib" 文件夹。 然后,在 "Lib" 文件夹中找到 "site-packages" 文件夹。 接下来,在 "site-packages" 文件夹中找到 "pip" 文件夹。 在 "pip" 文件夹中,打开 "vendor" 文件夹。 进入 "vendor" 文件夹后,找到 "pyparsing.py" 文件,复制备份一份。 接下来,用任意文本编辑器打开 "pyparsing.py" 文件。 在文件中找到 "DEFAULT_MIRROR" 这一行,将其修改为 CSDN 源地址。 CSDN 源地址可以在 CSDN 官网上找到,一般形式为 "https://pypi.tuna.tsinghua.edu.cn/simple"。 修改完源地址后,保存文件并关闭。 然后,回到 Python 安装目录的命令行执行器,输入以下命令: python -m pip install --upgrade pip 这个命令会更新 pip 工具,使其使用新的 CSDN 源地址。 至此,Python 便已成功更换为 CSDN 源。接下来通过 pip 安装 Python 包时,系统将自动从 CSDN 源进行下载和安装。这样可以提高包的下载速度,并且在使用 CSDN 上的技术文章和代码时,可以更方便地获取依赖的包。 最后,需要注意的是,更换源时可以选择其他的国内开源镜像源,例如阿里云、清华大学等,根据自己的实际需求选择合适的源。 ### 回答3: 我们可以采取以下步骤来在Python中更改CSDN的软件源。 首先,我们需要使用pip配置程序来更改Python的软件源。为此,我们可以使用以下命令: ``` pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pip -U ``` 此命令将使用清华大学的镜像源安装或升级pip。 然后,我们可以使用以下命令将CSDN设置为Python的默认镜像源: ``` pip config set global.index-url https://pypi.csdn.net/simple ``` 这将更改pip的配置文件,使其使用CSDN作为默认软件源。 接下来,我们可以通过运行以下命令来验证更改是否成功: ``` pip config get global.index-url ``` 这将显示当前设置的镜像源URL,我们应该看到输出为"https://pypi.csdn.net/simple"。 现在,我们可以使用pip来安装或更新Python软件包,它们将从CSDN镜像源中获取。例如,要安装名为"numpy"的软件包,我们可以运行以下命令: ``` pip install numpy ``` 这将从CSDN获取numpy软件包并将其安装到Python环境中。 总结而言,要在Python中更改为CSDN的软件源,我们需要先使用pip安装或升级pip自身,并将CSDN设置为全局镜像源。然后,我们可以使用pip命令安装或更新Python软件包,它们将从CSDN镜像源中获取。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值