码农公社 210.net.cn 210是何含义?10月24日是程序员节,1024 =210、210既
210
之意。
Python爬取网页内容的所有关键词并保存至Excel,话不多叙,直接上代码。
本文爬取了www_runoob_com某页面展示的全部关键词。
import requests
import openpyxlfrom lxml
import etree
import re
url = 'https://www.runoob.com/w3cnote/common-english-terminology-in-programming.html'
# 得到响应结果
res = requests.get(url)
# xpath取值
selector = etree.HTML(res.text)
# 字母的索引
word_letter = selector.xpath('//h2/text()')
# 删除列表里前两个多余的值
del word_letter[0:2]
# print(word_letter)
# word_letter 最后的值为
# ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q'