爬取IP数据并自动上传到typecho博客

最新推荐文章于 2023-12-28 14:39:55 发布

凌叁儿

最新推荐文章于 2023-12-28 14:39:55 发布

阅读量220

点赞数

分类专栏：爬虫文章标签：爬虫 python

本文链接：https://blog.csdn.net/lingsaner/article/details/119984409

版权

设计背景及说明

依旧使用简单的函数和库，实现自动爬取89免费代理IP并将IP数据发布到本博客
目标如图：捕获.PNG

使用库

requests、bs4（爬虫）
html2text（html转markdown）
pytypecho（发布typecho文章）
datetime（获取当天时间作为标题）

代码流程

导入库

import requests
from bs4 import BeautifulSoup as BS
from pytypecho import Typecho,Post
import html2text as ht
import datetime

爬取数据

# 设置爬虫头，避免爬太多被禁止
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
# 定义爬虫函数，爬虫代理IP页面的表格块
def getip():
    for i in range(1,3):
        res = requests.get('https://www.89ip.cn/index_'+str(i)+'.html',headers

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

凌叁儿

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
爬取IP数据并自动上传到typecho博客

设计背景及说明依旧使用简单的函数和库，实现自动爬取89免费代理IP并将IP数据发布到本博客目标如图：使用库requests、bs4（爬虫）html2text（html转markdown）pytypecho（发布typecho文章）datetime（获取当天时间作为标题）代码流程导入库import requestsfrom bs4 import BeautifulSoup as BSfrom pytypecho import Typecho,Postimport html2text
复制链接

扫一扫