主页分为3个部分:
最近查询的微博用户
列出的用户表明在数据库中都有相应的信息,可以查看用户画像,点开后,如下图所示
列出了微博用户的基本信息,此外,还有5个按钮:
1. Stats:展示用户微博的基本信息,如每天发了多少微博,原创与转发的比例,等等。
2. Bow:使用词袋模型的用户画像。有条形图和词云2种表示。
3. Tfidf:使用Tfidf模型的用户画像。有条形图和词云2种表示。
4. LDA:使用LDA模型的用户画像。有条形图和词云2种表示。此外,还展示各个主题的词云和条形图。
5. 比较:列出3个模型的前10个词。
Status:
Bow、TF-IDF:
LDA:
比较:
用户相似度查询
输入2个微博用户的uid(在最近查询的微博用户列表中),出入2者的余弦相似度,以及共同词语。
查询微博用户
如果想要查询新的微博用户,可以使用该模块。
登陆weibo.cn,找到想要查询的用户,点开资料,就可以得到uid。
获取cookies:如下图所示,复制cookie冒号后面的内容,即可。
在得到uid与cookies之后,提交,会得到如下页面:
它表明后台爬虫正在爬取微博信息,当爬取完成后,单击“更新状态”按钮,会自动回到首页,此时在首页的“最近查询过的微博用户 ”就能找到该用户了。
提供微博用户账号:
用户名----密码----uid
15524172473----lqsw165332----7365525700
15524172468----jlpt420178----7365525325
18624098476----yaei501711----7365732405