boren - 学习用python爬取脑经急转弯

最新推荐文章于 2022-11-29 20:23:37 发布

少儿编程侯老师

最新推荐文章于 2022-11-29 20:23:37 发布

阅读量280

点赞数

分类专栏：学生作品 Boren 文章标签： python

更多内容可以联系少儿编程侯老师，微信data_ecology

本文链接：https://blog.csdn.net/houlaos/article/details/104058374

版权

学生作品同时被 2 个专栏收录

815 篇文章 0 订阅

订阅专栏

Boren

47 篇文章 0 订阅

订阅专栏

本文介绍了如何使用Python进行网络爬虫，通过实例详细讲解了如何爬取并解析脑经急转弯网站上的内容，涉及到了requests库的使用以及BeautifulSoup库进行HTML解析，适合初学者学习爬虫基础。

摘要由CSDN通过智能技术生成

import requests
import re
for yema in range(1,75):
    print("正在爬取第%d页"%yema)
    wangzhi ="http://www.2345.com/inner/jzw/%d.htm"%yema
    response = requests.get(wangzhi)
    # print(response.text)
    # .可以替代任意一个字符
    # * 指前面这个字符可以出现多次
    r =re.findall('<li><span class="table_left">(.*)</span>',response.text)
    f = open('text','a')
    for i in r:
        try:
            i = i.split('</span><span class="table_right"><a href="javascript:;" class="answer" οnclick="MM_popupMsg(')
            # print(i[0])
            f.write(i[0])
            f.write('\n')
            # print(i[1])
        except:
            continue  # 继续 跳出当前循环，进行下一次循环
    f.close()

# 匹配术：正则表达式
# re
s = """
nbvenkghmd ,fv,kgm x,dtr5foguhijhugyfgvhbjnkljhkgjhvbjjbcgfxvhbjkhvgchvbjknhvgcvhbjkhvghbjnkbhvg njbhvgbjSDTRFGJBHKNLKJHGVBJNKML;NBHVGCVHBJNKLJXFCGVHBJNKL;VFCGVHJKLHUGYFTCGVHBJHKGHCHBJKNJHVGB000000000152154@#$%^&*u(p)(trcgvhbfdxfcgASDADSASDDDD45/AD4./ADA4,4TS5RS.RASF2CZ46R87Z4knhv njkbhvjnkbhvbjn
"""
# f,g R F B @
import re
# # r = re.findall('f[a-z]g',s) # findall 发现所有
# # r = re.findall('r[0-9]f',s) # findall 发现所有
# #r = re.findall('B([0-9]*)@',s) # findall 发现所有
# r =re.findall("fdxfcg(.*)k",s)
# print(r)

# a = '大吉大利？几万吃鸡'
# a = a.split('？')
# print(a[0])

for i in range(10):
    if i == 5:
        continue
    print(i)