可爱的python下载_GitHub - palxiao/PythonWebSpider: 一个可爱的python简单爬虫

Python网络爬虫

语言环境:Python2.7

运行爬虫入口开始爬取 output.html查看结果

简单py爬虫,修改入口及解析器改变规则

新增存入数据库操作 需要插件(MySql)

补充:(折腾了很久,网上很多方法都试不通,最后在控制台import成功却也用不了)

mac下安装MySQL-python

下载MySQLdb源码

下面是1.2.5的版本

https://pypi.python.org/packages/source/M/MySQL-python/MySQL-python-1.2.5.zip#md5=654f75b302db6ed8dc5a898c625e030c

下载后解压,然后在终端cd到文件目录

修改 site.cfg, 修改下面内容:

由#mysql_config = /usr/local/bin/mysql_config

改成mysql_config = /usr/local/mysql/bin/mysql_config

否则会出现找不到 MySQL_config 的问题:

然后修改 _mysql.c, 把第 37 到 39 行注释掉, 如下:

//#ifndef uint//#define uint unsigned int//#endif(这一步我没做,不知何意)

然后再用 python ./setup.py build 编译

$ python ./setup.py build

然后再用 python ./setup.py install 安装

$ sudo python ./setup.py install

安装完成后导包出现:Reason: image not found

vi .bash_profile

进入编辑状态,在最后添加

export DYLD_LIBRARY_PATH="/usr/local/mysql/lib"

esc退出编辑后执行以下命令

:w

保存退出bash

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你可以使用Python中的requests和BeautifulSoup库来实现爬取DXY-COVID-19-Data项目的代码。下面是一个简单的示例代码,可以爬取指定GitHub项目的代码: ```python import requests from bs4 import BeautifulSoup # 设置请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # GitHub release页面地址 url = 'https://github.com/BlankerL/DXY-COVID-19-Data/releases' # 发送请求 response = requests.get(url, headers=headers) # 解析HTML页面 soup = BeautifulSoup(response.content, 'html.parser') # 找到最新的release版本 release = soup.find('div', {'class': 'release-entry'}).find('a', {'class': 'Link--primary'}).get('href') # 找到最新release版本的下载链接 download_link = 'https://github.com' + release + '/download/DXY-COVID-19-Data-' + release.split('/')[-1] + '.zip' # 发送下载链接的请求 code_response = requests.get(download_link, headers=headers) # 将下载的zip文件保存到本地 with open('DXY-COVID-19-Data.zip', 'wb') as f: f.write(code_response.content) print('下载完成!') ``` 在示例代码中,我们首先设置了请求头,然后发送了一个GET请求获取DXY-COVID-19-Data项目的release页面。接着,使用BeautifulSoup库解析HTML页面,找到最新的release版本和其下载链接。最后,发送下载链接的请求,将下载的zip文件保存到本地。请注意,这里只是一个简单的示例代码,实际使用时,还需要进行一些异常处理和反爬虫处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值