10年漫威,到底有多少角色。

640?wx_fmt=jpeg

扫码立即抢购CTA五一节特惠单日票单日会议票仅售299元(5.1-5.4)。


作者 | 小F

来源 | 法纳斯特(ID:walker398)


最近正值复联4上映,小F也发现了一个有趣的网站。


主要是关于漫威人物、漫威电影的图谱。


https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/index.html(复制到浏览器打开)


网站是基于Graph技术开发的。


其实之前小F也利用了有关Graph的库实现了一波人物的关系分析。


只不过分析结果比较粗糙而已~


下面是网站的概况,大家可以一览。


640?wx_fmt=png

640?wx_fmt=png


那么人家能做出这么酷炫的关系图,我们自己能不能实现呢?


这一期就利用网站提供的数据,使用Neo4j(NOSQL图形数据库)进行实战一波。


/ 01 / 获取分析


人物及人物关联信息从网站上获取,具体接口如下。


640?wx_fmt=png


数据为json格式,分别在「characters」和「relationship」中。


640?wx_fmt=png


这里的信息是分别指托尼·斯达克,关系「0」为朋友,斯蒂文·罗杰斯。


640?wx_fmt=png


/ 02 / 数据获取


具体代码如下:

 
 
import jsonimport requests
headers = { 'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
url = 'https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/data/marvel-data.json'response = requests.get(url=url, headers=headers)result = json.loads(response.text)
num = 0names = []item = {0: 'friend', 1: 'enemy', 2: 'creation', 3: 'family', 4: 'work', 5: 'love'}
for i in result['relationship']: subject = result['relationship'][i]['id'] object = result['relationship'][i]['target_id']
if subject not in names: names.append(subject) if object not in names: names.append(object)
relation = int(result['relationship'][i]['relationship']) with open('relation_message.csv', 'a+') as f: f.write(subject + ',' + object + ',' + item[relation] + '\n')
for j in names: num += 1 with open('names_message.csv', 'a+') as f: f.write(j + ',' + str(num) + '\n')
for k in result['characters']: id = result['characters'][k]['id'] name = result['characters'][k]['name'] status = result['characters'][k]['status'] species = result['characters'][k]['species'] with open('message.csv', 'a+') as f: f.write(id + ',' + name + ',' + status + ',' + species + '\n')


最后成功获取数据。


640?wx_fmt=png


人物名为简称,共计182个人物。


640?wx_fmt=png


1144条人物关系数据,4大类型。


下面是182个人物的一些详情信息。


640?wx_fmt=png


包含了人物的名字及简称,存活状态,人物属性。


/ 03 /  数据可视化


下面通过Neo4j对人物关系进行可视化。


Neo4j的安装这里就不细说了,大家可以自行百度。


开启Neo4j服务后,登陆Neo4j网站,初始化界面如下。


640?wx_fmt=png


先加载第一个文件。


640?wx_fmt=png


具体代码如下。

 
 
LOAD CSV  WITH HEADERS FROM 'file:///names_message.csv' AS data CREATE (:people{name:data.name, id:data.id});


下面加载第二个文件。


640?wx_fmt=png


具体代码如下。


 
 

LOAD CSV  WITH HEADERS FROM "file:///relation_message.csv" AS relations
MATCH (entity1:people{name:relations.subject}) , (entity2:people{name:relations.object})
CREATE (entity1)-[:rel{relation: relations.relation}]->(entity2)


点击1144按钮处,取消限制数,再点击全屏。


640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png


这里大致能看出来漫威的人物聚集情况。


第一大反派灭霸(thanos),原来这么孤立的。


这里由于人物太多,造成观察不便,所以对结果进行一些筛选。


比如筛选托尼·斯达克的朋友,运行下面的代码。

 
 
match p=(n:people{name:"tonys"})-[:rel{relation:"friend"}]->() return p;


得到下图结果。


640?wx_fmt=png


其中「thor」为「雷神」,「stever」为「美队」,「blackw」为「黑寡妇」,「vision」为「幻视」,「peterp」为「蜘蛛侠」,「bruceb」为「绿巨人」。


下面再来看一下美队的女友吧。


640?wx_fmt=png


佩吉·卡特和她的侄女莎朗·卡特,据说两人样貌极为相像。


/ 03 / 总结


本次只是对Neo4j的一些简单操作,后期或许会去深入了解。


此外漫威的这些人物信息,还可以玩出很多花样的。


也希望大家能去动手尝试尝试,做一枚硬核铁粉~


···  END  ···


CTA核心技术及应用峰会


CTA核心技术及应用峰会嘉宾最新揭秘!五月打卡杭州,共议机器学习与知识图谱技术与落地。


扫描二维码立即抢购五一节特惠单日票,使用优惠码「CTA-51th」,立减200元,单日会议票仅售299元(5.1-5.4)。


添加小助手微信15101014297,备注「CTA」,了解大会详情。


640?wx_fmt=jpeg

扫描二维码,立即获取CTA单日特惠票。

好的,下面是一个简单的漫威页面的HTML代码示例: ```html <!DOCTYPE html> <html> <head> <title>漫威官网</title> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> </head> <body> <header> <nav> <ul> <li><a href="#">首页</a></li> <li><a href="#">漫威电影</a></li> <li><a href="#">漫威漫画</a></li> <li><a href="#">漫威游戏</a></li> <li><a href="#">漫威商城</a></li> </ul> </nav> </header> <main> <section> <h1>欢迎来到漫威官网</h1> <p>漫威是全球最著名的漫画出版社之一,也是一家拥有多个超级英雄角色的娱乐公司。</p> </section> <section> <h2>漫威电影</h2> <p>漫威制作了很多受欢迎的电影,包括《复仇者联盟》、《钢铁侠》、《蜘蛛侠》和《黑豹》等。</p> <a href="#">查看更多漫威电影</a> </section> <section> <h2>漫威漫画</h2> <p>漫威出版了很多经典的漫画,包括《蜘蛛侠》、《X战警》、《复仇者联盟》等。</p> <a href="#">查看更多漫威漫画</a> </section> <section> <h2>漫威游戏</h2> <p>漫威也制作了很多受欢迎的游戏,包括《漫威蜘蛛侠》、《漫威复仇者联盟》和《漫威未来之战》等。</p> <a href="#">查看更多漫威游戏</a> </section> <section> <h2>漫威商城</h2> <p>在漫威商城中,你可以购买各种漫威相关的商品,包括T恤、玩具、模型等。</p> <a href="#">进入漫威商城</a> </section> </main> <footer> <p>版权所有 © 漫威公司</p> </footer> </body> </html> ``` 这是一个简单的页面,包括一个导航栏、一些主要内容区域以及页脚。你可以在这个基础上添加更多的内容和样式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值