网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
为了演示方便,这里以百度热搜为新闻早报数据源,
使用 Requests + BeautifulSoup 按热度,爬取热度最高的 15 条数据
import requests
from bs4 import BeautifulSoup
def baidu_top_tipic():
“”“百度热搜”“”
requests_page = requests.get(‘http://top.baidu.com/buzz?b=1&c=513&fr=topbuzz_b42_c513’)
soup = BeautifulSoup(requests_page.text, “lxml”)
# 查询
soup_text = soup.find_all(“div”, class_=‘c-single-text-ellipsis’, text=True)
top_list = []
for index, text in enumerate(soup_text):
top_list.append((s