Python爬虫练习1

from bs4 import BeautifulSoup

html='''
<div class="panel">
    <div class="panel-heading">
        <h4>Hello</h4>
    </div>
    <div class="panel-body">
        <ul class="list" id="list-1">
            <li class="element">Foo</li>
            <li class="element">Bar</li>
            <li class="element">Jay</li>
        </ul>
        <ul class="list list-small" id="list-2">
            <li class="element1">Foo-1</li>
            <li class="element1">Bar</li>
        </ul>
    </div>
</div>'''

soup=BeautifulSoup(html,'html.parser')
h4_1=soup.h4
print('h4:',h4_1)
print('h4的文本:',h4_1.text)
# ul1=soup.ul
# li1=ul1.li
ul1=soup.find('ul')
li1=ul1.findChild('li')
print('第一个ul下的第一个li的文本:',li1.text)
from bs4 import BeautifulSoup

soup=BeautifulSoup(open('default.html',encoding='utf-8'),'html.parser')

print('class为p2的段落:')
class_p2=soup.find_all('p',class_='p2')
for i in class_p2:
    print(i.text)

print('\nclass为p2的段落,且段落文本为"此段文字以26像素大小,玫红色字体显示2":')
class_p2_t1=soup.find_all('p',class_='p2',string='此段文字以26像素大小,玫红色字体显示2')
for i in class_p2_t1:
    print(i.text)

print('\ndiv,id为“divdemo1”,其文本:')
div=soup.find_all('div',id='divdemo1')
for i in div:
    print(i.text)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值