网站:
由于版权问题,这里可以某瓣网站为爬取对象
这里使用的是某歌的webdriver的调试
并在anaconda安装selenium库
在pycharm使用anaconda作为解释器
并在爬取后对影评进行编排
代码:
from selenium import webdriver
from selenium.webdriver.common.by import By
driver = webdriver.Chrome()
driver.get('想要爬取影评的网页')
elements = driver.find_elements(by=By.CLASS_NAME, value="影评所在的位置(class的名字)")
num = len(elements)
for i in range(num):
em = elements[i]
print('第%s条评论内容:%s' % (i + 1, em.text))
该文介绍了如何利用Python的Selenium库,通过Chromewebdriver调试,对某瓣网站上的影评进行爬取。在Anaconda环境中安装selenium,并在PyCharm中配置Anaconda作为解释器,然后找到影评的class名称,遍历并打印出所有评论内容。
464

被折叠的 条评论
为什么被折叠?



