欧盟《一般数据保护条例》(GDPR)你需要知道的

欧盟《一般数据保护条例》(General Data Protection Regulation,GDPR)将于 2018 年 5 月 25 日起正式施行,该法案虽然旨在加强对欧盟境内相关居民和个体信息和隐私数据的保护,但从整个信息产业来看,是一次历史性的突破。欧洲再次走到了世界的前列。从此,个人数...

2018-04-29 09:24:49

阅读数:605

评论数:0

用 Docker 搭建 Spark 集群

简介 Spark 是 Berkeley 开发的分布式计算的框架,相对于 Hadoop 来说,Spark 可以缓存中间结果到内存而提高某些需要迭代的计算场景的效率,目前收到广泛关注。 熟悉 Hadoop 的同学也不必担心,Spark 很多设计理念和用法都跟 Hadoop 保持一致和相似,并且在使...

2015-09-22 15:38:26

阅读数:10167

评论数:2

用 mongodb + elasticsearch 实现中文检索

而 elasticsearch 可以很好的支持各种语言的全文检索,但我们暂时又不想切换到 elasticsearch 作为后端数据库。 当然,可以在 web 应用中存储数据的时候,再主动写一份到 elasticsearch,但这无疑污染了原有的业务逻辑。 在 IT 行业,只要有需求的地方,必然...

2015-08-21 21:24:06

阅读数:13002

评论数:1

网络大数据分析 -- 使用 ElasticSearch + LogStash + Kibana 来可视化网络流量

简介 ELK 套装包括 ElasticSearch、LogStash 和 Kibana。 其中,ElasticSearch 是一个数据搜索引擎(基于 Apache Lucene)+分布式 NoSQL 数据库;LogStash 是一个消息采集转换器,类似 Syslog,可以接收包括日志消息在内的...

2015-04-28 10:35:03

阅读数:10627

评论数:0

网络天然是大数据的,大数据天然是网络的

The network is naturally bigdataing, while bigdata is inherently networking. --yeasy@blog 用英文表达似乎更加准确一些。 计算机科学发展了半个世纪,而网络的出现极大推动了计算机相关技术的爆发式进步。 计...

2014-05-22 11:00:12

阅读数:1024

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭