自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

转载 带你发现新大陆!解密图数据库

一、关系型数据库的不适性在众多不同的数据模型里,关系数据模型自20世纪80年代就处于统治地位,而且出现了不少巨头,如Oracle、MySQL,它们也被称为:关系数据库管理系统(RDBMS)。然而,随着关系数据库使用范围的不断扩大,也暴露出一些它始终无法解决问题,其中最主要的是数据建模中的一些缺陷和问题,以及在大数据量和多服务器之上进行水平伸缩的限制。同时,互联网发展也产生了一些新的趋势变化:...

2020-01-03 10:12:50 369

原创 2019 CCF BDCI “慧”聚郑州 “豫”见未来 费马科技成为优秀合作伙伴

在“大众创业、万众创新”的政策驱动下,越来越多的机构、政府单位组织数据竞赛。“数据竞赛”已经呈现出了独特的技术价值、业务价值和创新价值,等待着产业、学界、政府机构去进一步发现和运用。本届CCF大数据与计算智能大赛的举办地河南省郑州市地处华夏腹地,是中国历史文化名城、全国科技进步先进市,是中国重要的交通通讯枢纽和物流集散中心,更是中部地区对外开放的重要窗口。作为全球大数据与人工智能领域最具影响力...

2019-12-25 14:16:56 336

转载 【转载】某篇文章的读后感,谈一谈 9 款国产图数据库

作者知乎id:一路走好本人目前做图的底层存储引擎“分片和副本分布式可扩展”相关的研究,来满足业务的快速增长。本文内容大量来自被我阅读的文章。感谢王建奎博士~~华为先来说说最神秘的华为吧,华为的图数据库构建在多模数据库中,由高斯实验室负责原型研发,图数据库的 headcount 由任总钦点,图数据库在华为重要性可想而知,但是由于华为保密要求严格,凡事都不让对外说。技术领先,设计方案简单高效。...

2019-12-18 10:06:00 1701

原创 基于神威·太湖之光的超大规模图计算系统“神图” 2019-12-16 14:10:29 作者:Fma

林恒博士拥有清华大学计算机科学博士学位(2018 年获得)和中山大学数学专业学士学位(2011 年获得),费马科技公司联合创始人。其研究兴趣包括异构体系结构、图计算和大规模计算。他基于神威·太湖之光开发的 Graph500 基准架构在 Graph500 异构架构排名(2016 年 6 月)中名列第一,在整体排名中名列第二。以下为林恒博士在SC2018期间举办的 HPC Connection W...

2019-12-16 14:33:13 1551 1

原创 费马科技助力大型商业银行打造客户风险评估系统

某商业银行是由民间资本设立的全国性商业银行,作为创新型的商业银行,该银行不断挖掘数据价值,从而为客户提供更优质的金融服务。2017年,该银行与费马科技合作,基于费马图数据平台实现反洗钱系统及客户风险评估系统,提高200余倍的系统效率,惠及民生。面临挑战某大型商业银行是国内标杆型银行,始终坚持 “合规”、“安全”、“创新”。为提供更低利率、更有竞争力的金融服务,该商业银行一直不断挑战压缩坏账损...

2019-12-06 11:07:57 276

原创 大数据时代的新星,图数据库究竟是什么?

随着5G万物互联时代的到来,社交、电商、金融、物联网等行业织起了一张庞大而复杂的数据关系网,获得了新的发展空间。然而要想真正利用数据,获取越来越多、越来越复杂的关联数据中产生的业务价值,并非易事。为了应对大数据新时代的难题,工业界将越来越多的目光投向了图数据(Graph)。图数据是一种面向关联关系的数据模型,可以跨越数据障碍、有效地建模、探索和查询多种类型的异构数据,成为大数据时代的一颗新星。...

2019-11-22 10:02:19 327

原创 图计算系统发展简史(五)

本文是“图计算系统发展简史”系列文章的第五篇也是最后一篇,将介绍之前没有提及的图计算系统相关或是细分领域的一些工作。图计算语言之前我们提到的所有图计算系统都需要用户使用如C++、Java等程序设计语言来描述计算过程,很多时候不得不写比较长的代码,并且不同的系统通常有不同的API,可移植性非常低。因此,一个很自然的想法出现了:为什么不创建一套专门面向图计算的领域专用语言呢?Green-Marl...

2019-10-14 13:23:46 605

原创 6度联系人分析无压力 费马科技助力支付金融机构打造超大用户图谱

国内某大型支付金融机构是国内第三方支付领军企业,为个人和企业用户提供支付、征信、融资、社区金融等服务。为提供更快捷更安全的贷款审批服务,2018年该金融机构与费马科技合作,基于费马图数据平台构建全量用户关系图谱,充分发掘硬件设备的潜力,从用户的4度联系人分析拓展至6度联系人,使分析的数据规模实现数万倍的增长,全面提升风控等级,打造以用户为中心的共生系统。面临挑战国内某大型支付金融机构是国内领...

2019-09-27 15:14:03 183

原创 图计算系统发展简史(四)

本文是一系列文章的第四篇,将介绍图计算系统领域在COST这篇文章出现后的发展。Scalability! But at what COST?《Scalability! But at what COST?》这篇文章为大数据平台提供了一个衡量指标——COST(the Configuration that Outperforms a Single Thread,即超过单线程的性能所需要的配置)。针对一...

2019-09-20 11:19:54 390

转载 这匹“费马”有点酷

认识洪春涛,其实是在BDTC大会上,当时在微软亚太研究院的他还是一头长发,如今,身为费马科技的CEO,洪春涛用一头干练的短发迎接了老孙的来访。费马到底是一匹什么“马”?对于许多人来说,相对于微软亚太研究院,费马科技的名头就小多了。但如果聚焦到图数据库领域,这家由清华大学的多名博士联合组建,专注于图数据技术,为企业提供高性能图数据存储及分析平台的国家高新技术企业,还是颇有名气的。关于费马的名...

2019-09-09 14:27:15 310 1

原创 图计算系统发展简史(三)

本文是一系列文章的第三篇,将介绍图计算系统领域在Pregel/GraphLab/PowerGraph/GraphChi这些奠基性工作出现后的进展。我们将按照两个维度:使用的机器数量、是否使用外存作为内存的扩展,将图计算系统分为四个象限——单机内存、单机外存、多机内存、以及多机外存,分别介绍每个象限中的代表性系统。单机内存现代的多路服务器已经可以⽀持TB级别的内存容量,⾜够容纳边数在百亿规模以下...

2019-08-29 17:38:12 849

原创 图数据库LightGraph测试报告

本测试提供了LightGraph在Twitter关系图的导入、查询、分析效率,并与TigerGraph、Neo4j、JanusGraph、ArangoDB等图数据库进行比较。根据测试结果,LightGraph在各个场景的性能显著优于同类数据库。导入性能:LightGraph导入性能是TigerGraph和Neo4j的2倍以上,是JanusGraph和ArangoDB的35倍以上。延迟查...

2019-08-26 09:39:08 821

原创 图计算系统发展简史(二)

本文是一系列文章的第二篇,将介绍图计算系统领域的开山之作Pregel和各类衍生的开源系统,以及GraphLab团队的一系列工作。Pregel图计算在Google内部有很多应用场景,一个最经典的例子是PageRank——Google最早用来对网页进行排序的算法。而Google在2008年时就已经索引了超过一万亿的网页[1]!尽管使用MapReduce能够处理非常大规模的数据,然而日益增长的网页数...

2019-08-15 11:51:33 509

原创 图计算系统发展简史(一)

图论起源于18世纪欧拉对哥尼斯堡七桥问题的研究,并经由众多数学家乃至计算机科学家不遗余力的发展成为了我们解决很多实际问题的强力武器。如今,基于图模型的数据分析方法已经应用在了互联网的很多场景:社交网络分析、网页排序、社区发现……在天体物理学、计算化学、生物信息学等自然科学领域,图也有广泛的应用。然而,随着图数据规模的不断扩大,在图上进行计算的效率也变得越发重要,并由此引发了学术界和工业界一轮又一轮...

2019-08-12 17:07:04 740

原创 优化搜索体验 费马科技助力搜狗搜索实现万亿级网页分析

今天给大家分享一个图数据技术在互联网行业的应用。搜狗搜索是国内TOP级的搜索引擎,其搜索排序是基于PageRank算法实现(PR值),数据体量达到万亿级别,常规hadoop分布式计算方法无法实现全部网页的检索排序。因此,我们与搜狗搜索一起,基于图数据打造万亿级别的网页分析,实现全量网页PageRank算法计算,从“网站级”或“目录级”,支持到全量“网页级”,从而为搜索用户提供更精准更高效的信息搜索...

2019-08-05 13:40:53 288

原创 图数据库和图计算系统有什么区别?

对于广大刚刚接触“图数据分析”的用户而言,一个十分具有迷惑性的问题是:图数据库和图计算系统有什么区别?今天,我们就从技术层面来简单地说一说两者的不同之处。图数据库适合需要对子图进行并发操作的场景;图计算系统适合需要对全图进行迭代式计算的场景。图计算系统我们先从图计算系统开始。图计算系统面向的场景主要是全图分析类的任务,例如:计算每个顶点的PageRank;计算从某(几)个顶点出发到其它所有...

2019-07-18 10:30:08 494

原创 用“闪电计算”弯道超车 费马图数据破解关联分析瓶颈

随着中美贸易战愈演愈烈,在科技领域也不由得拉响了警报。“去IOE”多年,有很多成果也有很多无奈,在数据库领域,我们至今依然无法摆脱受制于人的局面。Oracle前段时间大规模裁员的事情带给我们很多反思,我们需要在系统软件领域深耕,尽早摆脱掣肘的局面,为中长期的谈判对抗上增加筹码。图数据技术显然会是系统软件领域弯道超车的机会之一。图是将信息中的实体,以及实体之间的关系,分别抽象表达成为顶点以及顶点...

2019-06-27 15:49:35 212

原创 100倍分析性能提升 清华冠军团队用图数据震惊世界

100倍分析性能提升 清华冠军团队用图数据震惊世界中美贸易战愈演愈烈,归根结底是美国对我们遏制和我们谋求持续发展之战。美国几次三番针对我国的科技公司,为我们敲响了警钟,科技自强是硬道理。我国虽然鲜有顶尖级的系统软件商业公司,但我们在科技领域并不缺少世界顶尖人才和成果。以清华大学朱晓伟博士为例,他在读期间专注于图计算领域,研发的Gemini分布式图计算系统,处理速度超出学术界最快系统10倍(通...

2019-06-27 15:40:28 278

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除