自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

omnispace的博客

专注AI,物联网,区块链,安卓以及相关安全技术

  • 博客(1692)
  • 资源 (6)
  • 收藏
  • 关注

转载 Python & JAVA Solutions for Leetcode

Python & JAVA Solutions for Leetcode (inspired by haoel’s leetcode)Remember solutions are only solutions to given problems. If you want full study checklist for code & whiteboard interview, p...

2019-06-17 17:05:59 600

转载 Entering God Mode — The Kernel Space Mirroring Attack

How Alibaba are researching using the hardware features of ARM MMU to enable God Mode in Android 8 terminalsWang Yong, a.k.a. Thomas King, is a researcher from Alibaba Security’s Pandora Lab. The ...

2019-06-13 09:33:30 450

翻译 【译】Ethereum Wallet in a Trusted Execution Environment / Secure Enclave

介绍在过去的几周里, Weeve团队已经从社区中获得了很多关于我们如何将以太坊钱包应用到我们的 weeveOS中的兴趣 。 weeveOS是一个开源操作系统,针对IoT-to-Ethereum进行了优化(在未来的版本中,我们将增加对其他区块链技术的支持)应用程序利用最先进的安全机制来保护以太网钱包免受网络攻击( GitHub )。 通过WeeveOS,该项目旨在为区块链实施安全可靠的物联网神谕...

2019-06-03 13:01:20 509

转载 High Scalability of Website Architecture

Here are some of the favorite posts on HighScalability...All the Stuff the Internet Says on Scalability articles. Explain the Cloud Like I'm 10 YouTube Architecture Hilarious Video: Relational Da...

2019-05-29 17:11:31 852

转载 网站架构相关PPT、文章整理(更新于2009-7-15)

在这篇blog中放置了我收集的一些网站架构相关的PPT和文章,提供给大家下载,如果大家有相关的好的PPT、文章的话,也欢迎推荐给我,非常感谢,:),这篇blog的内容也会随着我收集的东西增加而变化,同时也会增加我对于这些PPT、文章的看法和评价。1、amazonAmazon的分布式key-value存储系统(dynamo)的论文2、ebay(我对于eBay这几个PPT的一些看法和评价:http...

2019-05-29 17:08:58 194

翻译 【译】Understanding Linked Data Formats

在本文中,我们将通过检查其四种最常见的格式来探索RDF的外观:N-Triples,Turtle,JSON-LD和RDF / XML。编辑(04/05/2019):我将本文扩展为包含JSON-LD并添加了下面的内容部分。 我原本没有包含JSON-LD,因为我从未真正使用它,但同意需要添加它才能完整。内容介绍格式看起来像什么?哪种格式适合我?结论TL; DR附录介绍很简单,链接数据...

2019-05-28 18:32:41 470

翻译 Contextualizing Airbnb by Building Knowledge Graph

我想你去洛杉矶旅行。 第一步是访问A irbnb.com并搜索“洛杉矶”。在后端,查询“洛杉矶”被翻译成地图上的一个区块; 此块中的可用房屋将在许多搜索结果页面中返回。 这足以让你制定旅行计划吗?随着Airbnb逐渐走向成为端到端的旅行平台 ,我们越来越重要的是提供旅行见解,帮助人们决定何时旅行,去哪里以及旅行时 做些什么 。 例如,洛杉矶最受欢迎的地标和社区是什么? 是否有任何即将举行的音乐...

2019-05-28 18:28:58 261

翻译 【译】Deep Learning with Knowledge Graphs

上周,我在Connected Data London上就Octavian开发的方法发表了演讲,使用神经网络在知识图上执行任务。这是来自Connected Data London的演讲录音:在这篇文章中,我将总结那篇演讲(包括大部分幻灯片)并提供对我们影响最大的论文的链接。要了解有关构建下一代数据库查询引擎的新方法的更多信息, 请参阅我们最近的文章 。什么是图表?两个功...

2019-05-28 18:26:28 596

翻译 【译】Attacks against machine learning — an overview

这篇博客文章调查了针对AI(人工智能)系统的攻击技术以及如何防范它们。在较高级别,对分类器的攻击可以分为三种类型:对抗性输入 ,这是特制的输入,其目的是可靠地错误分类以逃避检测。 对抗性输入包括旨在逃避防病毒的恶意文档,以及试图逃避垃圾邮件过滤器的电子邮件。 数据中毒攻击 ,涉及将训练对抗数据提供给分类器。 我们观察到的最常见的攻击类型是模型倾斜,攻击者试图以这样的方式污染训练数据,即分...

2019-05-28 17:53:53 430

转载 AI新方向:对抗攻击

01 概述我在国内的两个著名的学术搜索网站 AMiner 和 Acemap 进行了调查,以 adversarial attack和相近意思的 poisoning attack 等词作为关键词搜索了相关的论文,以下是两个网站给出的论文数据分析图表。一方面,从图中很明显可以看出,在 2015 年直到今年,adversarial attack相关的论文显著增多,这说明了在机器学习发展飞速的今...

2019-05-28 17:46:07 1060

转载 详解机器学习中的梯度消失、爆炸原因及其解决方法

前言本文主要深入介绍深度学习中的梯度消失和梯度爆炸的问题以及解决方案。本文分为三部分,第一部分主要直观的介绍深度学习中为什么使用梯度更新,第二部分主要介绍深度学习中梯度消失及爆炸的原因,第三部分对提出梯度消失及爆炸的解决方案。有基础的同鞋可以跳着阅读。其中,梯度消失爆炸的解决方案主要包括以下几个部分。- 预训练加微调- 梯度剪切、权重正则(针对梯度爆炸)- 使用不同的激活函数- 使...

2019-05-28 17:13:59 519

转载 《微服务:从设计到部署》中文版

本书为 Chris Richardson 和 Floyd Smith 联合编写的微服务电子书 Designing and Deploying Microservices 中文版,其从不同角度全面介绍了微服务:微服务的优点与缺点、API 网关、进程间通信(IPC)、服务发现、事件驱动数据管理、微服务部署策略、重构单体。Github:https://github.com/oopsguy/micro...

2019-05-28 17:04:18 291

翻译 【译】深入理解LSTM网络

递归神经网络人类不会每时每刻都开始思考。 当你阅读这篇文章时,你会根据你对之前单词的理解来理解每个单词。 你不要扔掉所有东西,然后再从头开始思考。 你的想法有持久性。传统的神经网络无法做到这一点,这似乎是一个主要的缺点。 例如,假设您想要对电影中每个点发生的事件进行分类。 目前尚不清楚传统神经网络如何利用其对电影中先前事件的推理来告知后者。循环神经网络解决了这个问题。 它们是带有循环的...

2019-05-27 15:52:43 296

转载 Tensorflow - Named Entity Recognition

Tensorflow - Named Entity RecognitionEach folder contains a standalone, short (~100 lines of Tensorflow), main.py that implements a neural-network based model for Named Entity Recognition (NER) usin...

2019-05-08 16:50:41 549

转载 用双向lstm+CRF做命名实体识别(附tensorflow代码)——NER系列(四)

这一篇文章,主要讲一下用深度学习(神经网络)的方法来做命名实体识别。现在最主流最有效的方法基本上就是lstm+CRF了。其中CRF部分,只是把转移矩阵加进来了而已,而其它特征的提取则是交由神经网络来完成。当然了,特征提取这一部分我们也可以使用CNN,或者加入一些attention机制。接下来,我将参考国外的一篇博客《Sequence Tagging with Tensorflow》,结合ten...

2019-05-08 15:00:38 6454 1

转载 用CRF做命名实体识别——NER系列(三)

在上一篇文章《用隐马尔可夫模型(HMM)做命名实体识别——NER系列(二)》中,我们使用HMM模型来做命名实体识别,将问题转化为统计概率问题,进行求解。显然,它的效果是非常有限的。在深度学习技术火起来之前,主流的、最有效的方法,就是CRF(条件随机场)模型。本文不对CRF模型进行展开讲解,而是结合我之前参加的CCF BDCI的其中一个赛题,直接用CRF++工具进行实战。下面直接进入正题。1...

2019-05-08 14:58:58 2394

转载 用隐马尔可夫模型(HMM)做命名实体识别——NER系列(二)

上一篇文章里《用规则做命名实体识别——NER系列(一)》,介绍了最简单的做命名实体识别的方法–规则。这一篇,我们循序渐进,继续介绍下一个模型——隐马尔可夫模型。隐马尔可夫模型,看上去,和序列标注问题是天然适配的,所以自然而然的,早期很多做命名实体识别和词性标注的算法,都采用了这个模型。这篇文章我将基于码农场的这篇文章《层叠HMM-Viterbi角色标注模型下的机构名识别》,来做解读。但原文...

2019-05-08 14:56:56 8049 2

转载 Learn About Windows Console & Windows Subsystem For Linux (WSL)

Windows Subsystem for Linux (WSL) has made a lot of waves since it was announced at //Build 2016 in April 2016. But as with any new technology, many people have questions including:How doesBash on ...

2019-05-08 04:21:46 243

转载 Must-read papers on GNN

GNN: graph neural networkContributed by Jie Zhou, Ganqu Cui and Zhengyan Zhang.Survey papers Graph Neural Networks: A Review of Methods and Applications. Jie Zhou, Ganqu Cui, Zhengyan Zhang,...

2019-05-06 16:55:25 1069

转载 分布式入门,怎样用PyTorch实现多GPU分布式训练

这篇文章旨在阐述训练大规模深度学习模型时的分布式计算思想。选自 Medium,作者:Ayan Das,机器之心编译,参与:Nurhachu Null、路。具体来讲,本文首先介绍了分布式计算的基本概念,以及分布式计算如何用于深度学习。然后,列举了配置处理分布式应用的环境的标准需求(硬件和软件)。最后,为了提供亲身实践的经验,本文从理论角度和实现的角度演示了一个用于训练深度学习模型的分布式算法...

2019-05-06 16:30:02 2228

转载 小型动漫知识图谱的构建 (Python+Neo4j) (纯实践内容,基于bilibili所有正版番剧的动漫、声优、角色、类型)

数据源:bilibili所有番剧的详情页面的信息,共计3000+的番剧(已经整理好的数据和代码下文有链接)步骤1:抽取信息从各个详情页面中抽取信息,比如动漫这个节点的文件,大概内容如下这一步稍微有些麻烦的地方就是爬虫的时候数据可能会出现清理不干净的情况,比如某个name的前面或者后面有空格、换行符等奇怪的字符,会对后面建立relation的表产生很多麻烦,注意数据要清理干净。...

2019-05-05 16:49:35 1295

转载 scrapy爬虫代理——利用crawlera神器,无需再寻找代理IP

一、crawlera平台注册 首先申明,注册是免费的,使用的话除了一些特殊定制外都是free的。 1、登录其网站https://dash.scrapinghub.com/account/signup/填写用户名、密码、邮箱,注册一个crawlera账号并激活2、创建Organizations,然后添加crawlear服务然后点击 +...

2019-05-05 16:31:15 2779 2

转载 知识图谱实践篇(五):KBQA Demo

作为实践篇的最后一篇,我们将介绍如何用Python完成一个简易的问答程序。下图是demo的展示效果:查询结果为空,回答“I don't know.”;不能理解问句,回答“I can't understand.”。本实现参考了王昊奋老师发布在OpenKG上的demo“基于REfO的KBQA实现及示例”,读者也可以参考此示例,来完成本demo。下面谈谈本demo的流程。一、基本流程此d...

2019-05-05 16:29:49 948

转载 知识图谱实践篇(四):Apache jena SPARQL endpoint及推理

在上一篇我们学习了如何利用D2RQ来开启endpoint服务,但它有两个缺点:1. 不支持直接将RDF数据通过endpoint发布到网络上。2. 不支持推理。这次我们介绍的Apache Jena能够解决上面两个问题。一、Apache Jena简介Apache Jena(后文简称Jena),是一个开源的Java语义网框架(open source Semantic Web F...

2019-05-05 16:04:55 1711

转载 知识图谱实践篇(三):D2RQ SPARQL endpoint与两种交互方式

这次我们介绍利用D2RQ开启SPARQL endpoint服务和两种交互方式:在浏览器中进行查询或者编写python脚本进行交互。跳过之前实践篇练习的读者,需要做的准备有:导入数据到Mysql,下载mapping文件(项目地址)。一、SPARQL endpoint前一篇介绍SPARQL的文章中提到,SPARQL endpoint是SPARQL协议的一部分,用于处理客户端的请求,可以类...

2019-05-05 16:02:43 627

转载 知识图谱实践篇(二):关系数据库到RDF

上一篇文章介绍了我们所使用的数据。其实,知识图谱数据的来源主要有三个:结构化数据、半结构化数据和非结构化的数据。我们所使用的电影数据就是结构化的数据。半结构化的数据指的是数据有一定的组织形式,但较结构化数据而言更松散(属性名和属性值具有多样性,比如“生日”就有“出生日期”、“诞辰”等多种表达方式),例如百度百科、维基百科、互动百科等;对infobox(下图红框)中的属性和属性值做一定处理后,我们就...

2019-05-05 16:00:57 2128 1

转载 知识图谱实践篇(一):数据准备和本体建模

对知识图谱有兴趣的读者可以关注我的知乎专栏,主要介绍知识图谱的相关概念、技术,也包含一些具体实践。通过前面几篇文章的介绍,读者应该对知识图谱,其相关概念,以及语义网技术栈中的RDF,RDFS/OWL有了一定的了解。然而,之前我们都是在介绍一些概念性的东西。实践才出真知,理论掌握得再好,不能解决实际问题也只是纸上谈兵。因此,笔者准备开一个实践篇,结合理论篇,让读者能够从无到有构建一个领域知识图谱...

2019-05-05 15:56:09 7069 2

转载 一文揭秘!自底向上构建知识图谱全过程

阿里妹导读:知识图谱的构建技术主要有自顶向下和自底向上两种。其中自顶向下构建是指借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库里。而自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的信息,加入到知识库中。在本文中,笔者主要想分享一下自底向上构建知识图谱的全过程,抛砖引玉,欢迎大家交流。“The world is n...

2019-05-04 15:29:04 1168

转载 用tf的VocabularyProcessor创建词汇表vocab

学习tf的时候用到的一个词汇创建工具,比较方便,记录其使用方法。1. 导入from tensorflow.contrib import learnvp = learn.preprocessing.VocabularyProcessor(100, 0, tokenizer_fn=chinese_tokenizer)其中VocabularyProcessor(max_docum...

2019-05-04 15:22:50 664

翻译 如何在TensorFlow中训练Boosted Trees模型

在使用结构化数据时,诸如梯度提升决策树和随机森林之类的树集合方法是最流行和最有效的机器学习工具之一。 树集合方法训练速度快,无需大量调整即可正常工作,并且不需要大型数据集进行训练。在TensorFlow中,梯度增强树可以使用tf.estimator API,它还支持深度神经网络,广泛和深度模型等。 对于增强树,支持具有预定义均方误差损失( BoostedTreesRegressor )的回归和...

2019-04-27 15:49:18 1276

翻译 标准化Keras:TensorFlow 2.0中的高级API指南

TensorFlow正准备发布2.0版本 。 在本文中,我们希望预览TensorFlow的高级API标题的方向,并回答一些常见问题。Keras是一个非常受欢迎的高级API,用于构建和培训深度学习模型。 它用于快速原型设计,最先进的研究和生产。 虽然TensorFlow今天支持Keras,但是我们将Keras更紧密地集成到TensorFlow平台的其余部分。通过将Keras建立为Tensor...

2019-04-27 15:47:24 783 1

转载 新浪是如何分析处理32亿条实时日志的?

服务介绍随着实时分析技术的发展及成本的降低,用户已经不仅仅满足于离线分析。目前我们服务的用户包括微博,微盘,云存储,弹性计算平台等十多个部门的多个产品的日志搜索分析业务,每天处理约32亿条(2TB)日志。技术架构简单介绍一下服务的技术架构:这是一个再常见不过的架构了:(1)Kafka:接收用户日志的消息队列(2)Logstash:做日志解析,统一成json输出给Ela...

2019-04-18 18:20:25 311

转载 互联网亿级日志实时分析平台,一个码农半小时就可以搞定,只因ELK

一,前言人们常常说数据如金,可是,能被利用起的数据,才是“金”。而互联网的数据,常常以日志的媒介的形式存在,并需要从中提取其中的"数据"。从这些数据中,我们可以做用户画像(每个用户都点了什么广告,对哪些开源技术感兴趣),安全审计,安全防护(如果1小时内登录请求数到达一定值就报警),业务数据统计(如开源中国每天的博客数是多少,可视化编辑格式和markdown格式各占比例是多少)等等。之所...

2019-04-18 18:16:18 624

转载 亿级 ELK 日志平台构建实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程可以参考上篇 「从 ELK 到 EFK 演进」废话不多说,老司机们座好了,我们准备发车了~~~整体架构整体架构主要分为 4 个模块,分别提供不同的功能Filebeat:轻量级数据收集引擎。基于原先 Logstash-fowarder 的源码改造出来。换...

2019-04-18 18:14:37 434

转载 深入理解 Java 锁与线程阻塞

相信大家对线程锁和线程阻塞都很了解,无非就是 synchronized, wait/notify 等, 但是你有仔细想过 Java 虚拟机是如何实现锁和阻塞的呢?它们之间又有哪些联系呢?如果感兴趣的话请接着往下看。为保障多线程下处理共享数据的安全性,Java 语言给我们提供了线程锁,保证同一时刻只有一个线程能处理共享数据。当一个锁被某个线程持有的时候,另一个线程尝试去获取这个锁将产生线程阻...

2019-04-18 18:05:01 1114

转载 微信终端跨平台组件 Mars 系列(三)连接超时与IP&Port排序

前言Mars 是微信官方的终端基础组件,是一个使用 C++ 编写的业务无关、跨平台的基础组件。目前在微信 Android、iOS、Windows、Mac、WP 等多个平台中使用。Mars 主要包括以下几个独立的部分: COMM:基础库,包括socket、线程、消息队列、协程等基础工具; XLOG:通用日志模块,充分考虑移动终端的特点,提供高性能、高可用、安全性、容错性的日志功能...

2019-04-18 17:51:52 547

转载 微信终端跨平台组件 mars 系列(二) - 信令传输超时设计

前言mars 是微信官方使用 C++ 编写的业务性无关、平台性无关的终端基础组件,目前在微信 Android、iOS、Windows、Mac、Windows Phone 等多个平台中使用,并正在筹备开源,它主要包含以下几个独立的部分: COMM:基础库,包括 socket、线程、消息队列、协程等基础工具; XLOG:通用日志模块,充分考虑移动终端的特点,提供高性能、高可用、安全...

2019-04-18 17:50:34 414

转载 微信终端跨平台组件 mars 系列(一) - 高性能日志模块xlog

前言mars 是微信官方的终端基础组件,是一个使用 C++ 编写的业务性无关,平台性无关的基础组件。目前已接入微信 Android、iOS、Mac、Windows、WP 等客户端。现正在筹备开源中,它主要包括以下几个部分: comm:可以独立使用的公共库,包括 socket、线程、消息队列等 xlog:可以独立使用的日志模块 sdt:可以独立使用的网络诊断模块 ...

2019-04-18 17:48:49 379

转载 Android微信智能心跳方案

前言:在13年11月中旬时,因为基础组件组人手紧张,Leo安排我和春哥去广州轮岗支援。刚到广州的时候,Ray让我和春哥对Line和WhatsApp的心跳机制进行分析。我和春哥抓包测试了差不多两个多礼拜,在我们基本上摸清了Line和WhatsApp的心跳机制后,Ray才告诉我们真正的任务——对微信的固定心跳进行优化,并告诉我们这不是一件容易的事情。于是我和春哥开始构思第一个方案,我们开始想用...

2019-04-18 17:31:27 978

转载 高性能日志框架 Log4a 原理分析

Log4a 是一个基于 mmap, 高性能、高可用的 Android 日志收集框架WHY Log4a:如果觉得还不错,欢迎 start,fork。Log4a 使用 mmap 文件映射内存作为缓存,可以在不牺牲性能的前提下最大化的保证日志的完整性。 日志首先会写入到 mmap 文件映射内存中,基于 mmap 的特性,即使用户强杀了进程,日志文件也不会丢失,并且会在下次初始化 Log4a...

2019-04-18 17:28:08 2481

客户端启动出现错误无法运行的解决办法(缺失的jar文件)v1.2

基于java开发的客户端在64位机器上启动的时候有时候会无法运行,出现“invalid resource”的错误, 所提供的jar文件是常见的一个缺失文件。具体使用请参见博客。

2019-05-27

python客户端启动出现错误无法运行的解决办法(缺失的jar文件)v1.2

基于java开发的python客户端在64位机器上启动的时候有时候会无法运行,出现“invalid resource”的错误, 所提供的jar文件是常见的一个缺失文件

2019-05-24

python客户端启动出现错误无法运行的解决办法(缺失的jar文件)

基于java开发的python客户端在64位机器上启动的时候有时候会无法运行,出现“invalid resource”的错误, 所提供的jar文件是常见的一个缺失文件。

2019-04-30

[原版高清图文]Python深度学习+2018中文版pdf+英文版pdf+源代码

目前市面上最好的关于如果使用python来做深度学习的书。作者是Keras之父、谷歌大脑人工智能和深度学习研究员François Chollet。资源包括原版中英文,还有附带的源代码。这样你可以一边看书,一边实践,快速掌握用python来做各种深度学习的技巧。

2019-01-14

CVE-2015-3636资料整理

最近学习CVE-2015-3636资料整理 最近学习这个漏洞遇到了各种问题,最后在github上看到一份大牛的poc后,稍作修改后的nexus4调通成功获取到了root权限。稍有遗憾没实现跳过PXN的保护

2016-03-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除