今天记录从excel表中读取成语,输入网站查询,获取成语的常用程度,并写入excel中;(之前的方式是直接从谷歌搜索结论数,但是谷歌的人机校验实在不好绕过,且时间成本很高,所以换了个直接有成语常用度数据的网站,选对合适的网站就简单得很)。
完整代码及分析如下:
# from selenium import webdriver
# from selenium.webdriver.common.by import By
# from selenium.webdriver.common.keys import Keys
# from selenium.webdriver.support import expected_conditions as EC
# from selenium.webdriver.support.wait import WebDriverWait
# import re
# import time
# import openpyxl as op
#
# browser = webdriver.Chrome()
# items = []

本文介绍了一种通过Python爬虫技术,从Excel读取成语,利用网站3Du.tw查询成语的常用程度,并将结果写回Excel的工作流程,避免了使用谷歌搜索的繁琐验证过程。作者详细展示了代码实现和数据处理步骤。
最低0.47元/天 解锁文章
436

被折叠的 条评论
为什么被折叠?



