python 爬取网页信息---通俗例题,直接跑

import requests
import re
from bs4 import BeautifulSoup


def get_html(url):
    headers = {
        'User-Agent': 'Mozilla/5.0(Macintosh; Intel Mac OS X 10_11_4)\
        AppleWebKit/537.36(KHTML, like Gecko) Chrome/52 .0.2743. 116 Safari/537.36'

    }  # 模拟浏览器访问
    response = requests.get(url, headers=headers)  # 请求访问网站
    html = response.text  # 获取网页源码
    return html  # 返回网页源码


soup = BeautifulSoup(get_html('https://www.jianshu.com/'), 'lxml')  # 初始化BeautifulSoup库,并设置解析器
print(get_html('https://www.jianshu.com/'))
for li in soup.find_all(name='li'):  # 遍历父节点
    for a in li.find_all(name='a'):  # 遍历子节点
        if a.string == None:
            pass
        else:
            print(a.string)  # 输出结果

output


前台妹子:没有学历有多现实
张二真实故事驿站
十八岁那年,我被“包养”了。
江蓠子
大型产品经理PUA现场
明天上线
用户故事地图的使用方法
小hoho
做好自己
直着蓝
阴盛阳衰的单位,是种灾难
金错刀618
把一件事情持续做三年是一种什么样的体验呢?
践侠客

 

后期更新

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值