NetEase Cloud Music Fans Network
以网易云用户为一个个节点,一旦一个用户A是另一个用户B的粉丝,则 [ A , B ] = 1 [A, B] = 1 [A,B]=1, 否则 [ A , B ] = 0 [A, B] = 0 [A,B]=0, 形成一个adjacency Matrix.最后将网络可视化。
主要包括两个部分:
- 爬虫
- 粉丝网络绘制
- 资源文件
爬虫
使用python
+ selenium
,对粉丝信息进行爬取
from selenium import webdriver
import math
browser = webdriver.Chrome()
browser.implicitly_wait(30)
根据用户ID进入用户粉丝列表,获取其粉丝ID
def fanInfor(fanID):
URL = "https://music.163.com/#/user/fans?id=" + fanID
browser.get(URL)
#switch to iframe id="g_iframe"
browser.switch_to.frame("g_iframe")
name = browser.find_element_by_xpath("//*[@id='j-name-wrap']/span[1]").text
degree = int(browser.find_element_by_id("fan_count_down").text)
#one page max fan id =