python day3--爬取每日一句

最新推荐文章于 2022-12-03 11:29:46 发布

不要绝望总会慢慢变强

最新推荐文章于 2022-12-03 11:29:46 发布

阅读量472

点赞数

分类专栏： python学习例子爬虫

本文链接：https://blog.csdn.net/luoshiyong123/article/details/103468455

版权

python学习例子同时被 2 个专栏收录

17 篇文章 1 订阅

订阅专栏

爬虫

5 篇文章 0 订阅

订阅专栏

import requests
import re
from bs4 import BeautifulSoup

url='http://wufazhuce.com/one/'#每一期的链接共同的部分
words=['0']*1800#定义一个长度为1800的列表，用来保存每一句话，并初始化为全‘0’
for i in range(0,100):
    s=str(i)#数字类型转为字符串类型
    print(i)
    currenturl=url+s#当前期的链接
    try:
        res=requests.get(currenturl)
        res.raise_for_status()
    except requests.RequestException as e:#处理异常
        print(e)
    else:
        html=res.text#页面内容
        soup = BeautifulSoup(html,'html.parser')
        a=soup.select('.one-titulo')#查找期次所在的标签
        b=soup.select('.one-cita')#查找“每日一句”所在的标签
        #print(b)
        index=re.sub("\D","",a[0].string.split()[0])#从“vol.xxx”提取期次数值作为下标
        #print(index)
        if(index==''):
            continue
        #print(b[0].string.split())
        words[int(index)]=b[0].string.split()#将该期“每日一句”存入列表
        #print(words[int(index)])
print("begin!!!!!!!!!!!!!!!")      
f=open('C:\\Users\\lsy\\Desktop\\one.TXT','w')#将每句话写入这个txt文件中，先打开
for i in range(1,1774):
    if(words[i]=='0'):
        continue
    else:
        print(words[i])
        f.writelines('VOL.'+str(i)+'\n')#写入期次和换行
        f.writelines('    ')#每句话开始空四格
        f.writelines(words[i])#写入该句话
        f.writelines('\n\n')#换行，并空一行写入下一句        
f.close()#关闭文件

不要绝望总会慢慢变强

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
python day3--爬取每日一句

import requestsimport refrom bs4 import BeautifulSoupurl='http://wufazhuce.com/one/'#每一期的链接共同的部分words=['0']*1800#定义一个长度为1800的列表，用来保存每一句话，并初始化为全‘0’for i in range(0,100): s=str(i)#数字类型转为字符串类型...
复制链接

扫一扫

专栏目录