python 简单爬虫

from bs4 import BeautifulSoup
from requests_html import HTMLSession

session = HTMLSession()
my_response = session.get("http://www.17k.com/")
soup = BeautifulSoup(my_response.text, 'lxml')
book_list = soup.select('dd ul li a ')
book_url={}
for book in book_list:
    soup_tmp=BeautifulSoup(str(book), 'lxml')
    url_tmp = soup_tmp.a.attrs['href']
    book_name = soup_tmp.a.string
    book_url.update({book_name:url_tmp})
    print(book_name+":"+url_tmp)
#或存放到列表中
#print(book_url)

部分结果:
九星霸体诀:http://www.17k.com/book/1398783.html
校花的全能保安:http://www.17k.com/book/2459058.html
正道潜龙:http://www.17k.com/book/2731559.html
女总裁的全能兵王:http://www.17k.com/book/1741975.html
天行:http://www.17k.com/book/2722533.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值