硬核黑科技告诉你,漫威 10 年到底有多少个角色?

640?wx_fmt=gif

640?wx_fmt=jpeg

作者 | 法纳斯特

责编 | 郭芮

最近正值复联4上映,笔者也发现了一个有趣的网站,主要是关于漫威人物、漫威电影的图谱。

640?wx_fmt=png

https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/index.html

其实之前笔者也利用了有关Graph的库实现了一波人物的关系分析,只不过分析结果比较粗糙而已~下面是网站的概况,网站是基于Graph技术开发的。,大家可以一览。

640?wx_fmt=png640?wx_fmt=png

那么人家能做出这么酷炫的关系图,我们自己能不能实现呢?本文就利用网站提供的数据,使用Neo4j(NOSQL图形数据库)进行实战一波。

 

640?wx_fmt=png

获取分析

 

人物及人物关联信息从网站上获取,具体接口如下:

640?wx_fmt=png

数据为JSON格式,分别在「characters」和「relationship」中。

640?wx_fmt=png

这里的信息是分别指托尼·斯达克,关系「0」为朋友,斯蒂文·罗杰斯。

640?wx_fmt=png

 

640?wx_fmt=png

数据获取

 

具体代码如下:

 

 

import json
import requests

headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}

url = 'https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/data/marvel-data.json'
response = requests.get(url=url, headers=headers)
result = json.loads(response.text)

num = 0
names = []
item = {0'friend'1'enemy'2'creation'3'family'4'work'5'love'}

for i in result['relationship']:
    subject = result['relationship'][i]['id']
    object = result['relationship'][i]['target_id']

    if subject not in names:
        names.append(subject)
    if object not in names:
        names.append(object)

    relation = int(result['relationship'][i]['relationship'])
    with open('relation_message.csv''a+'as f:
        f.write(subject + ',' + object + ',' + item[relation] + '\n')

for j in names:
    num += 1
    with open('names_message.csv''a+'as f:
        f.write(j + ',' + str(num) + '\n')

for k in result['characters']:
    id = result['characters'][k]['id']
    name = result['characters'][k]['name']
    status = result['characters'][k]['status']
    species = result['characters'][k]['species']
    with open('message.csv''a+'as f:
        f.write(id + ',' + name + ',' + status + ',' + species + '\n')

最后成功获取数据。

640?wx_fmt=png

人物名为简称,共计182个人物。

640?wx_fmt=png

1144条人物关系数据,4大类型,下面是182个人物的一些详情信息:

640?wx_fmt=png

包含了人物的名字及简称,存活状态,人物属性。

 

640?wx_fmt=png

数据可视化

 

下面通过Neo4j对人物关系进行可视化,Neo4j的安装这里就不细说了,大家可以自行百度。开启Neo4j服务后,登陆Neo4j网站,初始化界面如下:

640?wx_fmt=png

先加载第一个文件:

640?wx_fmt=png

具体代码如下:

 

LOAD CSV  WITH HEADERS FROM 'file:///names_message.csv' AS data CREATE (:people{name:data.name, id:data.id});

下面加载第二个文件:

640?wx_fmt=png

具体代码如下:

 

LOAD CSV  WITH HEADERS FROM "file:///relation_message.csv" AS relations
MATCH (entity1:people{name:relations.subject}) , (entity2:people{name:relations.object})
CREATE (entity1)-[:rel{relation: relations.relation}]->(entity2)

点击1144按钮处,取消限制数,再点击全屏。

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

这里大致能看出来漫威的人物聚集情况,第一大反派灭霸(thanos),原来这么孤立的。

这里由于人物太多,造成观察不便,所以对结果进行一些筛选,比如筛选托尼·斯达克的朋友,运行下面的代码。

 

match p=(n:people{name:"tonys"})-[:rel{relation:"friend"}]->() return p;

得到下图结果:

640?wx_fmt=png

其中「thor」为「雷神」,「stever」为「美队」,「blackw」为「黑寡妇」,「vision」为「幻视」,「peterp」为「蜘蛛侠」,「bruceb」为「绿巨人」。

下面再来看一下美队的女友吧。

640?wx_fmt=png

佩吉·卡特和她的侄女莎朗·卡特,据说两人样貌极为相像。

 

640?wx_fmt=png

总结

 

本次只是对Neo4j的一些简单操作,后期或许会去深入了解。此外漫威的这些人物信息,还可以玩出很多花样的。也希望大家能去动手尝试尝试,做一枚硬核铁粉~

面试Python工程师会有哪些问题?需要如何准备?

https://edu.csdn.net/topic/python115?utm_source=cxrs_bw

作者:法纳斯特,Python爱好者,专注爬虫,数据分析及可视化。

声明:本文首发个人公众号法纳斯特,作者投稿,版权归其个人所有。

640?wx_fmt=png

640?wx_fmt=jpeg

作为码一代,想教码二代却无从下手:

听说少儿编程很火,可它有哪些好处呢?

孩子多大开始学习比较好呢?又该如何学习呢?

最新的编程教育政策又有哪些呢?

下面给大家介绍CSDN新成员:极客宝宝(ID:geek_baby)

戳他了解更多↓↓↓

640?wx_fmt=jpeg

 热 文 推 荐 

☞扎心!工作 10 年,月薪过万者不足三成,程序员却笑了

☞为什么程序员都特想要机械键盘?

☞互联网公司脱发白皮书

☞天才程序员:25 岁进贝尔实验室,32 岁创建信息论

华为在剑桥建芯片厂;小米公布出货量反驳调研机构; 中移动否认限制号 | 极客头条

☞安全顾问反水成黑客, 靠瞎猜盗得5000万美元的以太币, 一个区块链大盗的另类传奇

☞如何确定最佳训练数据集规模?6 大必备“锦囊”全给你了 | 技术头条

☞动图:程序员才懂的这些!

 “别再埋头学Python了!”上线收获 3.6W 程序员热议,你怎么看?

 

System.out.println("点个在看吧!");
console.log("点个在看吧!");
print("点个在看吧!");
printf("点个在看吧!\n");
cout << "点个在看吧!" << endl;
Console.WriteLine("点个在看吧!");
Response.Write("点个在看吧!");
alert("点个在看吧!")
echo "点个在看吧!"

 
 

640?wx_fmt=gif点击阅读原文,输入关键词,即可搜索您想要的 CSDN 文章。

640?wx_fmt=png你点的每个“在看”,我都认真当成了喜欢

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值