摘 要
摘要内容:这次实验采用“世界—区域—国家”的数据立方体思想,从宏观到微观的分析角度分析签证政策与国际形势的联系。依据全世界199个国家和地区的签证数据,通过Gephi、power BI、pyecharts等可视化软件或工具,绘制模块化网络、地图、热力图、流向图、条形图、堆叠图、树状图等,分析并解释世界范围内联盟发展状况和国际形势、亚洲范围内国家抱团现象、中国内地和港澳台地区的签证差异等。
目 录
一、概述
1.1 背景
2020年5月9日,新冠疫情在全美肆虐之际,美国国土安全部在《联邦公报》网站上发布了一份名为《外国新闻媒体代表进入美国的许可和延长逗留时间》的新规定,计划针对中国媒体记者收紧签证政策,限制入境停留时间为90天。
在今天这个全球化的世界中,签证规定在控制外国国民跨越国境时扮演着极为重要的角色。如今几乎所有国家都要求非本国国民在试图入境时取得签证,尤其发达国家对于来自发展中国家人民的签证核发标准更是极其严格,以防范非法移民的流入,发展中国家国民的国际旅行自由度也受到很大的限制。
随着我国综合国力的不断提升,我国硬实力建设取得了显著成就,居民收入不断提高,国民消费水平也不断提升。我国国民的出境旅游、广大的留学生群体以及经济全球化背景下各国之间愈加频繁的经贸往来,对于其他国家的经济发展的影响也越来越大,很多国家看到了中国民众强大的消费能力,同时伴随着我国“一带一路”的政策推行,我国与他国之间的各种往来所涉及的范围不断扩大,程度不断加深。
故而出于对国家利益的考虑,很多国家正不断放宽对于我国的签证政策,因为上述活动主要仍需要民众间的交流进行推动。在这些国家中,如日本、南太岛五国等,都是随着我国发展不断放宽对我国的签证政策,加强国际间交流。
当两国之间的民众交流对两国都有利时,设置签证带来的壁垒就不利于两国之间的交往,国家自然会放宽对于目标国国民签证的限制,免签一定程度上又将进一步促进国际交流。所以我们可以看到,不同程度的免签是政府做出的决策,而这一决策影响着民众的活动(即所谓的公共外交),所以说,免签这一行为释放的是某一国家从上至下对另一国家的善意信号,也是期望改善国家间关系的讯号。所以说,国家间对于签证的政策一定程度上是可以反映国际关系局势以及国际关系走向的。
就以我国为例,在我国建国初期,我国公民想要办签证出国旅游或者是工作都是十分困难的,需要提前好几个月开始准备签证的手续和流程,才可以获得签证。而随着中国的不断地发展进步,尤其是最近一段时间一带一路的政策的发展和各个国家的加入,使得对中国免签国家数量不断增多,这也反映了我国的国际关系环境正在不断改善。
在大二下学期的专业选修课社会计算上我们小组就选择了这个题目,但当时遗憾于时间紧迫所以很多可视化角度没能实现,在这学期数据可视化课上,我学习了时间、比例、关系数据可视化和交互,就想能否进行更多样的可视化展示和更深层次的分析。
1.2 目的与意义
签证主要起到限制别国公民入本国境内的作用,一般情况下,签证是签证申请人所在国度和申请国度间综合实力的体现。而国际关系由国家利益所决定,对不同国家实行不同的签证政策是政府综合国家利益做出的选择;国家间对于签证的政策一定程度上可以反映彼此之间关系形势以及国际关系形势。所以对于签证的分析集中于各个国家对自身利益和发展的考虑。通过对国家签证关系的可视化来初步研究国际形势和预测分析国家行为。包括国家关系解释、国际形势演化评价、国际关系衡量(联盟内部)等。
1.3 总体思路
整体思路是采用“世界—区域—国家”的数据立方体思想,从宏观到微观的分析角度分析签证政策与国际形势的联系,最后突出中国自身签证情况的分析。
1.以世界各国为研究单位
①不考虑权值的情况下、只看出入度,相当于不考虑签证的类型、只看是否需要签证,分析入度高、出度高以及出度占比高的国家;
②考虑签证的情况下,设定一个比较模块度,得出社群,观察社群内部的共同点以及社群间的区别和联系;
③联盟之间的对比(找联盟中心节点):
一般认为,护照免签国和经济发展程度有关,但是人均GDP(国际汇率)比中国低,护照免签国却比中国多的国家很多,从整理出的数据中我们发现部分人均GDP比中国低的国家却可以拥有更多的免签国:中美洲、南美洲各国,似乎因为他们处在一个经济合作组织里面(南美洲国家联盟、中美洲统合体),在内部通行自由,南美各国通过身份证就可以前往其他联盟中的国家,因此更容易在对外的签证谈判中获得有利条件,所以即使某些国家收入水平很低(比如洪都拉斯、尼加拉瓜等),依然可以取得很好的签证条件。还有一种情况,例如秘鲁公民可以凭借公民身份证前往阿根廷和智利,而阿根廷和智利可以免签申根国,那么秘鲁也就非常容易与申根国家达成签证免除协议。本质上是看联盟的效力,所以在实验中引入了世界范围内较为知名的联盟之间的对比。
2.以洲为研究单位
这里没有选取欧洲,是因为欧盟内部各国之间全部免签,且欧洲各国很容易获得签证优惠,可能有欧盟的拉拢以及吸引观光或劳工等方面的考虑,所以将欧洲整体的签证情况作为研究对象没有意义。在洲的层面上,选择最熟悉的亚洲进行分析。
3.以中国为研究单位
小国似乎更容易获得免签待遇,即使国家比较贫困,比如某些太平洋岛国;非穆斯林国家似乎能得到更好的签证待遇:卡塔尔、巴林、沙特阿拉伯虽然收入水平很高,但是免签国普遍只有八十多个(不过还是比目前的中国多一些);对其它国家签证宽松的国家,也比较容易获得更宽松的签证条件。在人均GDP(国际汇率)比中国低、护照免签国却比中国多的国家中,把大洋上的小岛国、南美经济共同体、中美洲统合体、欧洲国家去掉后只剩下纳米比亚、泰国、莱索托,而纳米比亚和莱索托又是非洲联盟的成员国,泰国又是东盟国家,也同样具有联盟优势。
而查阅资料发现不结盟策略是最初中国发展的战术,中国一直奉行和平共处五项原则和独立自主的外交政策,具体提倡并推崇国家之间的交往奉行相互尊重主权和领土完整,互不侵犯,互不干涉内政,平等互利,和平共处基本理念。中国奉行军事不结盟政策,所以没有加入任何的军事联盟。中国这样的非联盟国能成为如今的世界大国实在是令人钦佩,当然这也是导致中国的免签国少的主要原因:中国的经济发展水平虽然相对较高,但由于不属于任何一个具有通行便利的国家间组织、不处于欧洲(欧盟或申根区无意拉拢),人口众多,对入境签证管制严格,所以免签的国家少也就不足为奇。
所以单独将中国的签证情况作为研究对象,由于政治、历史等因素,中国内地与港澳台的签证情况差别较大,内地由于社会制度、意识形态以及宗教政策等多方面原因导致自己对外国和外国对自己的签证政策都相对较严格。而香港因为其独特的经济水平和历史原因,受到了较多数国家的签证优待;而台湾的情况处于二者之间。所以将内地与港澳台分别考虑,进行分析。
二、数据收集
2.1 数据获取
本次实验从绿野移民项目网站https://www.gfcvisa.com/中获取签证信息数据,该网站提供专业移民信息服务,数据源较为权威完整,获取方式是用Java语言编写爬虫程序从该网站爬取签证数据。少量的该网站的缺失国家数据由人工补录。最后获取了包含199个国家或者地区在内的4万多条数据。

数据源网站

数据爬取主程序

数据获取归档

EXCEL节点表与连边表
2.2 数据清洗
绿野移民项目网站包括护照对全球199个国家和地区的免签情况,其中部分地区如香港澳门台湾和中国大陆的免签情况不同,所以仍然单独列出。
规范化国家名称。具体规则如下:
统一称谓:刚果——刚果布;刚果民主共和国——刚果金;科特迪瓦(象牙海岸)——科特迪瓦;科特迪瓦(科特迪瓦)——科特迪瓦;捷克的——捷克;斐——斐济;马其顿(FYROM)——马其顿;北朝鲜——朝鲜;巴勒斯坦领土——巴勒斯坦;俄罗斯联邦——俄罗斯;火鸡——土耳其;梵蒂冈城——梵蒂冈;
港澳台前加中国二字;
删掉多明尼加共和国,因为其与多米尼加重复;
人工标注,手动输入拉脱维亚的各项数据。(网站的该国数据网页在维修更新中)
2.3 数据处理
根据签证类型的力度,赋予权重。这里是根据难易程度赋予,分成1-5这5个区间。(我之前考虑到权值除以总国家数,但因为199个国家之间相互都有签证往来,不存在多少。而如果除以免签的总数,对部分类型不好取值,比如需要旅游卡、访客许可证和免签其实差不多,如果要除的话还要统计这些的总个数,网页上只有免签总个数,要统计的话工作量太大;而且意义不大,因为除了个别国家之外,大部分国家的免签个数、需要签证个数的比例差不多,对最终的分析结果影响不大;并且看图的时候只看出入度也能直观看到个别免签多的国家。)
部分签证政策类型的解释:
免签
不需要签证,拿上护照说走就走;
落地签
不需要在出国前提前办理签证,在入境时办理,交费,立等可取;
电子签证、电子签、E-Visa
提供证件是扫描件,对申请者来说比较方便,不用担心证件损坏等问题。申请者无需到使馆申请,只需通过网站将准备好的电子签证证件递交给使馆,使馆在系统里直接就可以看到申请者的证件,签证出签后,使馆会将签证发送给申请者,直接将其复印出来即可。由于递交的证件比较少,使馆审核的时间也不会过长,大概只需4个工作日即可,而普通签证由于办理过程比较麻烦,递交的证件比较多,所以使馆办理的时间也会比较长,大概为10-14个工作日左右。电子签证的通过率会比普通签证的通过率要高。
抵达时签证、落地签、落地签证
有效期短,费用高,可以不去其大使馆申请签证,而是直接就去,到飞机落地之后再临时现场办理签证。
访客许可证
任何国籍人士进入塞舌尔均无需签证,旅客将于塞舌尔入境时获发访客许可证。根据两国签订的互免签证协定,中国公民普通护照持有者来塞舌尔度假、经商或探亲访友者可以获得停留不超过30天的“访问许可”,必要时可申请延长至3个月。
抵达时签证放弃
在卡塔尔国常见,我理解的是类似于落地签放弃。
ETA、ETA电子登记系统
Electronic Travel Authorization,旅行电子授权。只要持有电子通行证,无需再申请签证。
具体的权值赋予表格:
类型 | 权值 | 难易 |
签证需要、需要签证 | 0 | 5 |
需要旅游卡 | 4 | 1 |
免签、免签证 | 5 | 0 |
签证/ eVisa | 2 | 3 |
电子签证、电子签 | 2 | 3 |
抵达时签证、落地签、落地签证 | 1 | 4 |
到达签证/ eVisa | 2 | 3 |
访客许可证 | 4 | 1 |
抵达时签证放弃 | 4 | 1 |
ETA、ETA电子登记系统 | 4 | 1 |
免签证计划 | 5 | 0 |
电子签证或落地签证 | 2 | 3 |
电子签证/抵达时免签证 | 2 | 3 |
抵达时免签证 | 4 | 1 |
抵达时免费入境许可 | 4 | 1 |
抵达时的旅游卡 | 4 | 1 |
EVW | 3 | 2 |
eVistors | 2 | 3 |
边权设置规则
经过数据清洗,形成了可供分析带权重的边数据表格。这里可以把权重简单地理解成办理签证的难易程度,权重越大,签证办理越容易,目标国对该国的关系越亲近。
其他加工:
计算部分国家或地区的各类型签证政策的实施数量:在excel中选择工具栏中的公式,点击插入函数,选择COUNTIF()函数,在Range中选择计数范围,即对该国的全部签证类型,在Criteria中选择值,即具体的签证类型。

三、可视化工具及原理
3.1 Gephi
Gephi是开源、免费、跨平台、基于JVM的复杂网络分析软件,其主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。
这次实验主要运用Gephi进行出入度计算、社群检测、聚类系数计算。其中,聚类系数定义为A的任意两个朋友彼此也是朋友的概率。A的聚集系数即为与A相邻的节点之间边的实际数与A相邻节点对的个数之比。
这里本来准备使用RStudio中的社会网络分析包igraph,它适用传统图论算法:最小生成树,网络流等以及复杂网络处理算法:随机网络模型,网络处理,社区发现算法等。可处理无向图、有向图,但无法处理混合网络。可以调用C/C++/R/ Python语言,速度快,函数命令与图形展现丰富。这次实验主要运用R语言的igraph包实现了对小规模数据集的可视化网络构建,辅助gephi网络进行分析。因为签证权值中包含0,即在构造网络时会有节点间没有连线,所以R语言模块化的适用性不大。
3.2 power BI
Power BI 是一套商业分析工具,可连接数百个数据源、简化数据准备并提供即时分析,生成美观的报表并进行发布,供组织在 Web 和移动设备上使用。
这次实验主要运用Power BI的桌面版软件Power BI Desktop,绘制中国签证的流向地图、条形图、堆叠图、树状图等。
3.3 pyecharts
pyecharts将python与echarts结合进行数据可视化,用 Echarts 生成的图可视化效果非常直观,pyecharts 是为了与 Python 进行对接,方便在 Python 中直接使用数据生成图。通过下载中国省级地图包可以直接导入地图框,通过修改map函数的具体参数赋值可以更改地图的细节,如标题、颜色、标签、标记等。
这次实验主要利用pyecharts中的Map、Geo()地图组件来进行全球地理区域的数据可视化。
四、可视化过程
4.1可视化网络及模块化
将数据清洗后获得的文件导入Gephi 中,国家签证网络的数据整理完成,国家是节点,国家与国家的签证关系形成连边,签证类型是连边的权值。对网络进行优化:节点和边的大小分别由度和权重来决定;依据社群检测结果对节点用颜色进行社群区分。
以亚洲国家模块化为例:采用的聚类算法是GN算法,删除边界数最大的边,导入数据后可以得到各个节点的出度与入度,度,聚类系数;
1、导入:选择文件后,点击导入读取电子表格。
2、根据图形的紧密程度,在布局中调整斥力强度:

3、点击右侧的统计中的网络概论,可以看到出入度:


平均聚类系数:

平均路径:

点击数据表格栏可以查看具体的资料信息:



点击统计中的“平均路径长度”:

以大小为依据渲染节点:

分割后得到模块化结果:



调节边按照权重显示:

插入标签,并且设置大小:


过滤掉边缘点:

模块化结果:


4.2 pyecharts
#世界签证免签地图
from pyecharts import Map
import pandas as pd
# 读取数据
data=pd.read_excel('E:/学习学习学习/【必】数据可视化/大实验/附件/附件4:世界国家签证分析/世界签证指数排名.xlsx')
value=list(data['指数'])
attr=list(data['nation'])
map = Map("世界签证指数地图", width=1200, height=600)
map.add("世界签证指数地图", attr, value, maptype="world",is_visualmap=True, visual_text_color='#000',visual_range=[24,176])
map.render(path="世界各国免签地图.html")
4.3 power BI中的可视化
以条形图绘制为例:(其他图的绘制过程类似)
1.导入我们需要的数据。点击工具栏中的获取数据按钮,选择导入文件的格式。

2.找到需要导入文件的位置,选择这个文件,点击打开。经过载入以后,在导航器中勾选需要导入的Excel页,点击加载。

3.软件共有报表、数据、模型三个界面,报表界面主要是直观地显示可视化成果;数据界面可以对导入的源数据进行筛选、转换和类型格式转换;模型界面主要用于多个表间建立联系。

模型界面创建关系的过程,类似于数据库创建联系,对相同的图例创建“多对多”关系。


4.点击左边的报表按钮,进入可视化界面。选择可视化工具栏中的簇状柱形图按钮,在字段按钮中,选择需要的字段。如果字段过多,切换不方便,可以采取逆透视,把有关联字段转换为一行然后用切片器进行筛选。在字段栏,选定指标添加到轴和值后,图形会自动显示。

5.在格式栏中可以对x轴、y轴的颜色、文本;数据颜色、标签;背景;边框;图形纵横比等进行调整。

6.在分析栏可以选择添加恒定、最大值、最小值、平均值、中值、百分位数线等。

7.在页面左部分自动显示可视化结果。筛选器可以选择显示某些值的范围。

五、可视化结果分析
5.1 世界分析
5.1.1签证指数分析
着重分析不同节点的入度、出度和出度-度比值,试图找出在国际签证格局中突出的国家。其中,节点的入度表示该国开放的免签国家数量(注:因为赋予权值时是根据难易程度,而软件会自动将权值为0的连线去除,所以这里的免签其实是包含除需要签证外的各种签证政策类型,可以理解成放宽签证办理过程的政策),出度表示该国被其他国开放的免签数量。入度大是指对别国免签多,出度大是指别国对该国免签多。
①入度分析
选取连入度最高的25个国家。

入度最高的25个国家
选取了连入度最高(为198)的25个国家,也就是说这些国家对世界上其他国家和地区采取了不同程度的免签方式。普遍说来,其入度高主要有以下两个原因:
①可以看到这些国家多为一些小国,国民数量较少,故而内需或许不足。为了促进经济发展,比如说吸引别国人民到这些国家去旅游或者到当地开展商业活动,这些国家的签证政策相对是比较宽松的,在签证方面限制较少。
②由于多为小国,对于别国人在当地定居的吸引力比较小,不必过于担心人口涌入可能带来的社会经济、政治、文化问题,所以其宽松的签证政策为自身的经济发展带来的影响利大于弊。
但是我们看到一个相对来讲出乎意料的国家:澳大利亚。澳大利亚国土面积广阔,虽然地广人稀,但是是发达国家,按理来说是不太需要过多外来刺激拉动经济增长的,难道澳大利亚就不担心自己过于宽松的免签政策可能吸引太多人到澳大利亚来,从而引发一系列问题吗?

澳大利亚旅游业产值

澳大利亚旅游业产值

澳大利亚近五年GDP增速(2019年还没有数据)
澳大利亚所面临的经济转型使得其经济发展越来越依赖于服务业,然而幅员辽阔的澳洲,由于宜居地区相对较少,光靠澳大利亚国内人口的内需难以拉动经济增长,而且澳大利亚自然风光好,很多地方虽然不适宜居住,却非常适宜开辟成景点。同时通过上面几张表格可以看到,从2014年起至2018年,澳大利亚旅游业的增速大多数时候都高于GDP的增速,所以旅游业对于澳大利亚的作用比我们想象的更加重要。
②出度分析:
选取了出度较高的一些国家:

世界签证指数较高的国家条形图(出度最高的国家)
这里引入世界签证指数,按照不同国家的公民前往海外所享有的免签证国家数而创建,即各个国家公民享有的国际旅行自由度,同时也显现了每个国家和地区的经济发展水平和与其他国家的关系。

世界签证指数地图(pyecharts)

世界签证指数热力地图
在世界签证指数地图中通过交互显示标签,可以清楚地看到这些红色区域和国家基本上都是出度较高的国家,且都是发达国家。我认为发达国家受欢迎主要有以下几点原因:
①发达国家人口素质较高,对发达国家免签相对来讲可以吸引更高素质、更文明的游客,所以大家都愿意对他们免签。
②发达国家人均收入较高,消费能力强,对他们免签可以较好地提升自身旅游业和服务业的发展,促进经济增长。
③大部分发达国家人口算不上太多,而且这些国家的人民在本国已经享受了非常好的福利待遇,不太可能在对它免签的国家或地区久居,所以开放免签也基本上不会出现人口过多的问题。
但是这之中一个比较独特的例子就是马来西亚:它经济发展状况一般,人口较为稠密,却有较多国家选择对它免签。我猜测原因如下:
①它是多个国际组织的成员国:英联邦(去英联邦国家比如英国、澳洲和纽西兰都很方便,欧盟也放行);伊斯兰会议(打开了通往伊斯兰国家的大门);不结盟运动(这个现在没什么用,但以前还是贡献了一点免签国);东南亚联盟(东南亚免签)
②马来西亚是贸易国家,跟很多免签国都有重要的贸易往来,而且地理位置优越,位于一个重要的海峡——马六甲海峡附近,所以很多国家对于马来西亚免签更多是出于经济利益。
③出度-度比值分析
我猜测:如果一个国家的签证政策对其他国家越紧,而其他国家对它的签证政策反而很宽松,那么认为这个国家就很受欢迎。进而我们的指标是出度占度数的比例,出度-度比值分析中,除去国内政治局势混乱的国家,得到出度-度比值较高的国家。
(说明:由于排名在前的国家基本上对外免签都非常少,而且国内政治局势相对复杂,感觉不太具有分析价值,所以将点度限定为大于或等于100之后,再根据“出度/点度”的值进行了排序)

出度-度比值较高的国家
可以发现,名列前茅的主要还是发达国家,排名靠前的国家的确也符合当今世界移民数量较多的国家。比如美国、加拿大、新西兰、欧洲国家等。但是与出度高的国家的排名出入较大,这主要是因为这张表中排名靠前的国家入度普遍来讲较低,也就是说他们自身对别国签证政策比较严格。
我认为其中一个很重要的原因是:这些国家或地区绝大多数发展情况较好,外来人口的流入或者是旅游业的发展对于提振经济作用不大,反而可能由于政策的放开吸引过多人口流入,带来一系列社会问题,所以相对来说会限制外来人员的流入,其签证政策相对严格。
而对他们免签的国家或地区数量大多也是出于贸易往来、以及旅游业等第三产业的发展对自身经济发展的需要,倒也并不是这些国家在国际关系中有多么得人心。
这其中一个非常典型的例子就是美国,美国对别的国家免签极少,但别的国家却争先恐后给美国免签,我认为这并不是美国的行为多么令人喜欢,最受欢迎并不意味着最受认可,而是因为美国是世界上第一大经济体,通过对美国免签,可以吸引更多美国人来到本国旅游和消费,也有利于吸引美国跨国企业在本国的投资,所以许多国家对于美国免签主要也是出于经济利益的考量。
5.1.2全球社群检测分析
在用Gephi对国家间签证关系网进行社群检测时,经过多轮的解析度的设定,当解析度为标准值1、考虑权值时,模块度最高,社群检测的效果最好。

此时,该网络分为3个社群,红色社群和绿色社群的国家都很多,两大社群之间分布着蓝色社群的国家。

国家间的签证关系网络图
可以看到国家间签证关系网可以分为3个部分,将社群检测结果放在世界地图上。结合两图很明显可以观察到,绿色的是欧美经济发达区,橙色的是亚非经济欠发达地区,蓝色的是中间连接区。

社群检测结果在世界地图上映射
可见,全球签证格局泾渭分明,发达国家(地区)和发展中国家(地区)在签证上关系分别自成一体。全球经济格局影响着全球签证格局。
在蓝色的中间连接区,这些国家或地区主要是中国香港、俄罗斯、肯尼亚、南非以及斐济、毛里求斯等著名旅游小国。中国香港是国际化大都市,对外交流非常频繁,位于中间连接区很好理解。而俄罗斯位于中间连接区,处于亚洲和欧洲的连接地带,虽然作为资本主义国家但目前同欧美关系疏远,俄罗斯在政治上被主要西方国家(美国、英国、德国、法国等)孤立,俄罗斯并没有与主要西方国家建立免签关系,只有41个国家对俄罗斯实行方便的签证政策,而俄罗斯又和一些亚非国家开放了签证政策,因此俄罗斯身处中间连接区。肯尼亚、南非是有潜力的新兴市场国家,外资吸引力度很大;斐济、毛里求斯等小国的经济严重依赖于旅游业,历史上大多是殖民地,因此它们与发达国家和发展中国家的签证往来政策都比较友好。
欧美经济发达区的签证关系内聚一是为了加强彼此的经济合作与交流,二是因为欧美经济发达区的国家防止贫困地区的移民。而亚非欠发达地区一般都希望引进发达地区的人才和资金;为了旅游业的发展,彼此之间也不会过度在签证关系上设防。
5.1.3不同联盟的签证关系分析
国家联盟是邦联制的全称。是指若干个独立的主权国家为实现某种特定目的(如军事、经济方面的要求)而组成的一种松散的国家联合。由于签证政策影响到了相互的经贸、教育等往来,分析不同国家联盟的签证关系旨在发现和验证国家联盟联系的紧密程度。因此,我选取英联邦、阿拉伯国家联盟和东南亚国家联盟进行对比分析。
本次实验使用平均局部聚类系数和网络紧密程度来衡量国家联盟内部的关系。其中,紧密程度依赖于国家联盟内部签证连边的数量和连边的权值,对于每一个国家联盟内部联系的紧密程度,引入紧密程度指标进行测量,计算公式如下:

①英联邦:
下图是英联邦(1931成立)国家间的签证关系图,平均聚类系数是0.772,紧密程度为0.48.

英联邦国家签证关系网
英联邦国家的前身是大英帝国及其殖民地,如今英联邦国家在经济、教育上保持着一些合作。维持英联邦的老大哥是英国,虽然大多数英联邦国家之间有着良好的签证政策,但是老大哥对其他英联邦国家的签证政策还是比较严格的,英国只对29个英联邦国家实行签证优惠,未来这一数量还可能会继续减少。从近几年的国际形势看,未来的英联邦存在的意义可能会越来越弱。

英国在英联邦国家签证关系网的指标
②东盟:
下图是东盟(1967成立)国家间的签证关系图,平均聚类系数是0.989,紧密程度为0.98

东盟国家签证关系网
东盟的平均聚类系数和紧密程度都非常高,这说明东盟国家之间几乎都开放了无障碍地免签政策。东盟及其优惠地签证关系可以侧面反映出其政治、经济合作关系的紧密程度,显然东盟是一个十分团结的区域性政治组织。
③阿拉伯联盟:
下图是阿拉伯国家联盟国家(1944成立)间的签证关系图,平均聚类系数是0.602,紧密程度为0.23。

阿盟国家签证关系网
阿盟成立于二战之后,其成立宗旨是“密切成员国间的合作关系,协调彼此间的政治活动,捍卫阿拉伯国家的独立和主权,促进阿拉伯国家的整体利益,推动各成员国在经济、财政、交通、文化、卫生、社会福利、国籍、护照、签证、司法等方面进行密切合作。但是在70年代之后,围绕着石油,西亚地区陷入了长期的战乱。阿盟国家签证关系的紧密程度仅为0.23,联盟已经失去了意义。
5.2 亚洲国家分析
亚洲国家名单(48)
东亚5国:中国、朝鲜、韩国、日本、蒙古。
东南亚11国:越南、老挝、柬埔寨、泰国、缅甸、菲律宾、马来西亚、文莱、新加坡、印度尼西度亚、东帝汶。
西亚19国1地区:沙特阿拉伯、科威特、伊朗、伊拉克、以色列、土耳其、叙利亚、约旦、塞浦路斯、黎巴嫩、巴勒斯坦地区、巴林、亚美尼亚、格鲁吉亚、阿塞拜疆、卡塔尔、也门共和国、阿富汗、阿曼、阿拉伯联合酋长国。
中亚5国:哈萨克斯坦、乌兹别克斯坦、土库曼斯坦、吉尔吉回斯斯坦、塔吉克斯坦。
南亚7国:印度、巴基斯坦、孟加拉国、尼泊尔、不丹、斯里兰卡、马尔代夫。
按照可视化过程,导出数据资料表格中亚洲国家之间签证连入度、连出度、度、聚类系数、模块化。
5.2.1出入度分析
1.连入度较高的国家(阿拉伯联合酋长国、阿塞拜疆、巴林、东帝汶、马尔代夫、缅甸、尼泊尔、斯里兰卡、格鲁吉亚)

亚洲国家中入度高的国家
2.连出度较高的国家(马来西亚、日本、塞浦路斯、新加坡、韩国、中国香港)

亚洲国家中出度高的国家
5.2.2社群检测分析
模块化结果:


亚洲国家间签证的网络关系
从数据资料可以看到分成了3个模块:
蓝色模块:(阿拉伯联合酋长国:、巴林、马尔代夫、东帝汶、孟加拉国、尼泊尔、巴勒斯坦、斯里兰卡、黎巴嫩、约旦、卡塔尔、印度、科威特、阿曼、沙特阿拉伯、也门、不丹、朝鲜、巴基斯坦、阿富汗)
橙色模块:(缅甸、中国澳门、老挝、柬埔寨、印度尼西亚、菲律宾、泰国、新加坡、中国香港、日本、韩国、文莱、塞浦路斯、以色列、中国台湾、蒙古、中国、越南)
绿色模块:(格鲁吉亚、阿塞拜疆、马来西亚、伊朗、亚美尼亚、土耳其、吉尔吉斯斯坦、哈萨克斯坦、塔吉克斯坦、乌兹别克斯坦、土库曼斯坦、叙利亚、伊拉克)

亚洲国家聚类系数地图
分析与猜测:
①西亚国家抱团。这主要得益于2018年以来,丝路签证政策在乌兹别克斯坦、吉尔吉斯斯坦、塔吉克斯坦、土库曼斯坦、阿塞拜疆、土耳其、哈萨克斯坦7个国家中得以推行。一张签证就可以畅游7国,在地域上包括了西亚的全部国家和中亚的2个国家。

西亚国家抱团地图
②东亚三国(中日韩)关系紧密。东亚三国,经济水平相当,有相似的文化背景,大致都可以算得上是无神论国家。虽然,历史方面来说,中日,日韩之间在历史上有巨大的矛盾,而且短期来看并没有刻意有效解决的趋势,政治方面来说,领土上有中日钓鱼岛争端,日韩独岛争端,而中韩关系始终存在朝鲜问题这一巨大芥蒂,更不用说各自国内必然会有强大的反对势头。但是在国际方面来说,冷战后美国政府的战略重心从欧洲地区转移到亚太和中东地图,美国在亚洲地区的战略存在和对中国的遏制必然是美国的战略重心,如果东亚三国可以有效成立一个共同体,美国在日韩地区的军事和政治存在的理由必然就站不住脚,可以想象,美国必然会不顾一切的分离各国关系,遏制东亚地区的共同体存在。
③宗教因素影响较大。比如印度是印度教国家,泰国是佛教国家,中东地区是伊斯兰教国家。不像欧洲大多数都是基督教国家,在宗教方面不会有巨大的差异,在不可调和的宗教冲突前,亚洲国家区域化明显。
④东南亚国家联盟抱团明显,且和中国联系紧密。东盟十国(文莱、柬埔寨、印度尼西亚、老挝、马来西亚、缅甸、菲律宾、新加坡、泰国、越南)总体来说坚持议题式外交,即安全靠美国,经济靠中国。弱国无外交,所以这也是他们的权宜之计——在中美两个大国之间左右摇摆,谁也不敢真正得罪;同时,对双方又都保持一定距离,也是为了争取利益最大化。
⑤发达国家区分明显。发达国家并没有公认的标准,但是通常认为亚洲有4个发达国家,即:日本,韩国,新加坡,以色列。可以看到中国和这些国家联系紧密,即人均GDP来衡量中国虽然不是一个发达国家,但是中国的GDP总量、基础设施建设等都处于亚洲前列。
⑥加入一带一路的部分国家如哈萨克斯坦、亚美尼亚、格鲁吉亚和阿塞拜疆联系紧密。
5.3 中国分析
因为各种政治因素,中国内地和港澳台的签证情况不同,以下是中国、中国香港、中国台湾、中国澳门对比。
5.3.1港澳台分析
①签证关系网



内地与港澳台的签证关系网


内地和港澳台的签证关系网的局部放大
②流向地图
在签证关系流向图中,绿色代表别国对自己的签证优待,橙色代表自己对别国的签证优待,可以看到,内地的连线比较稀疏,澳门连线密集。

中国香港签证关系流向地图(GIF图)

中国澳门签证关系流向地图(GIF图)

中国台湾签证关系流向地图(GIF图)
③树状图
将别国对中国内地、香港、澳门、台湾的签证政策按照类型-数量绘制树状图,可以看到每种签证类型的比例。

中国香港签证树状图

中国澳门签证树状图

中国台湾签证树状图
④堆叠柱形图

结合中国内地、中国香港、中国台湾、中国澳门在国际签证格局中的出入度:
香港:入度144,出度147
澳门:入度191,出度131
中国内地:入度16,出度71
台湾:入度63,出度132
从入度来看,本图的入度代表了其他国家在办理该国家的签证时的难易程度,入度越高代表其他国家在办理该国家的签证时越容易,这就代表了该国家对旅游业对外的产业等的依赖程度比较高。我们可以看到,澳门的入度最高,因为澳门本身经济就依赖于其博彩行业,因此相对来讲,澳门会放宽自身的签证限制来刺激他国的人员来澳门进行消费。
而出度则代表了该国家的国民去往其他国家的难易程度,出度越高则代表该国家去往其他国家越容易就代表了这个国家相对来讲更加的发达,这几个地区相对来讲香港出度最高,而且免签占比最大,这说明了其他国家更愿意接纳来自香港的居民。
5.3.2中国内地分析

中国内地签证关系流向地图(GIF图)

中国内地签证树状图
通过数据和图形可以看到中国的出度和入度都比较小,从出度方面考虑,人均GDP不是主要原因,中国人均GDP接近一万美元,在发展中国家中并不低。墨西哥人均GDP在中国前面仅一位,但是免签国很多。中国免签落地签国家71个,但是墨西哥有139个,我们猜测这主要归咎于人口。中国人口基数巨大,数量占比极小的公民滞留别国就可以给别国造成极大的麻烦,甚至取消中国免签地位。不过现在情况在变好,2010年以来非法入境和滞留的案例虽然还是有,但跟以前相比好了很多。免签也是国家信誉积累过程的一个体现,观察期和变现周期长。只有渐渐积累信誉,将来才可以成为自己和后辈的红利,虽然中国护照免签国数量仍不多,但确实有看得见的改变。
中国的入度也很小,我认为原因主要有这几个方面:首先,作为一个人口大国,中国本身的内需市场就已经足够拉动中国的消费,所以中国不需要开放签证来刺激市场,而且,中国本身的经济发展并不依赖于旅游行业,所以也不需要大面积开放签证来刺激人口流入;其次,中国对外发放免签时也要考虑种种因素。对于发达国家,中国要考虑国家安全的因素,如防范欧盟(英国、法国、爱尔兰、德国、卢森堡、比利时、荷兰、西班牙、葡萄牙、奥地利、意大利、马耳他、希腊、克罗地亚、斯洛文尼亚、斯洛伐克、匈牙利、罗马尼亚、保加利亚、爱沙尼亚、拉脱维亚、立陶宛、波兰、捷克、丹麦、塞浦路斯、瑞典、芬兰)情报共享和五眼联盟(英国、美国、加拿大、澳大利亚、新西兰)的情报互通(冰岛虽然也不是欧盟的,但是其实和欧盟联系太紧密了);对于宗教势力较强的国家,中国要防范传播极端思想的传播风险(穷国和中东国家,信仰伊斯兰教的国家可能给中国传播极端思想,穷国国民可能滞留国内非法就业影响社会安定,梵蒂冈这种国家有传教危险);对于极不发达国家和战乱国,中国要防范其居民非法滞留国内带来的各种风险;而对于美国的附属国或盟国(韩国、泰国、巴西、南非等国家具有美国CIA设置的特训基地),中国更是要加倍提防。
所以说,中国只能给剩下一些没有威胁的国家或地区免签。
六、心得体会
6.1 收获
这次报告不仅让我运用Gephi\power BI\flourish等可视化平台更加熟练,也让我对国家关系等政治知识有了初步的了解。
我认为国家之间签证政策的影响方面涉及经济、政治、文化、宗教等诸多方面,但根源上是由其国家利益决定的,国际关系以及国际形势也是在各国国家利益的基础上形成,一切都源于国家利益决定国际关系。
6.2 不足
限于时间、能力等因素,研究成果可能并不尽善尽美。
1.分析不够全面:因为相关文献较少,很少有学者系统地分析签证背后的影响因素,所以我们看了大量旅游网站的推文、知乎帖子、微博上政治专家大V的博文……也有很多影响因素是我们的猜测。毕竟国际关系过于复杂,签证关系的影响因素很多,除了国家关系,还包括经济发展情况、人口数量、政治因素、宗教因素等,有可能考虑不周。并且,源数据仅仅是签证数据,没有综合考虑其他的国家指标数据。
2.可视化成果多样化欠缺:本来准备做近几年的签证情况变化,进而分析国际形势演化,但是数据不够全面,所以并没有进行时间数据可视化等,可视化成果在时间线上可能偏单一。
3.源数据不全:在研究过程中,因为研究涉及全球国家,而我们的数据来源有限,仅包含了199个主要国家和地区的签证网络,部分国家地区数据缺失。
4.权值赋予问题:签证类型太多,但是为了方便,我只设置了5个整数权值段,区分度可能不够;我对签证类型和申请签证的难易程度不够了解,而且签证的难易程度没有统一的指标进行量化,部分签证是对申请人的身份信息要求严格,部分签证是办理流程和周期复杂,部分签证是有效期短等。所以,对不同签证的权值赋予还有待完善。
5.软件使用过程中出现的问题:
①因为国家数量较多,而且国家签证关系必须在有向图时才有意义,所以R语言社群检测的算法不适合用。
②gephi中的模块化不方便调节模块个数,不能细化分类。
③关于社群检测:
贪婪算法只适用于没有多条边的图:

自旋玻璃算法不能处理孤立点:

数据量太大无法展示:


6.3 感谢
附件:
附件1:199个国家签证数据。内含199个国家和地区的签证数据,格式为csv文件。
附件2:世界国家签证分析。内含199个国家或地区的签证数据赋予权值后的总表,世界各国免签地图和代码,模块化网络的Gephi文件,世界各国签证指数的条形图和热力地图的power BI文件,社群检测结果表格。
附件3:亚洲国家签证分析。内含亚洲国家模块化网络的Gephi文件和导出的数据资料,亚洲国家连出度、连入度条形图,聚类系数地图的power BI文件,社群检测结果表格及相关数据等。
附件4:中国内地港澳台签证分析。内含中国内地、港澳台的签证类型堆叠图、树状图的power BI文件,流向地图的gif文件,社群检测的Gephi文件及相关数据等。
参考文献:
[1]徐小平. 美国签证哲学[M]. 北京:世界知识出版社,1999:12- 15.
[2]金良浚. 世界各国签证与出入境指南[M]. 北京:中华工商联合出版社,1999:280- 285.
[3]朱兆瑞. 我如何获得40国签证[M]. 广西:接力出版社,2005:58- 75.
[4] 杨继,靳佳. 在思想上的国度遨游[M]. 北京:世界知识出版社,2003:125- 135.
[5] Vincent D Blondel,Jean-Loup Guillaume,Renaud Lambiotte,Etienne Lefebvre. Fast unfolding of communities in large networks [J]. Journal of Statistical Mechanics:Theory and Experiment,2008,10:1-15.