Задача: Используя Python и модуль requests и bs4 написать скрипт, извлекающий новости (отдельно заголовок, анотацию, авторов) из веб-страницы новостного агенства.
任务:使用Python的requests模块和bs4编写一个脚本,从新闻机构的网页中提取新闻(分别标题,注释,作者)。
由于这是我现在在俄罗斯学校的任务,因此用的俄罗斯的新闻。仅供参考。
https://russian.rt.com/world/article/705508-b-52-iran-ssha.html
第一步:引入所需的模块
第二步:提取当前新闻内容网页的代码
第三步:使用“开发者工具”可以发现,标题在以下位置
第四步:使用“开发者工具”可知晓,作者信息保存于什么位置,找出来,并提取: