爬取扣扣群成员
通过 https://qun.qq.com/member.html 这个网页你可以登录网页版的扣扣群号管理。
这样你就可以通过网页来爬取信息了。涉及到个人隐私,这里就不放图片了。
请看代码:
import csv
import time
from selenium import webdriver
# 下拉加载页面
def scroll_foot(driver):
js="var q=document.documentElement.scrollTop=100000"
return driver.execute_script(js)
# gid后面写自己要爬取的群号
url = "https://qun.qq.com/member.html#gid=730399676"
driver = webdriver.Chrome()
driver.get(url)
# 要往下滑动的次数,要滑动几次就写几次循环
for i in range(3):
scroll_foot(driver)
time.sleep(1)
# 爬出总的扣扣信息
elements = driver.find_elements_by_css_selector('tbody.list > tr.mb')
with open('QQ1.csv', 'a+', newline='', encoding='utf8') as f:
writer = csv.writer(f, dialect="excel")
writer.writerow(['昵称', 'QQ号', '性别', '