- 博客(11)
- 资源 (6)
- 收藏
- 关注
转载 Record linkage
Record linkage (RL) refers to the task of finding records in a data set that refer to the same entity across different data sources (e.g., data files, books, websites, databases). Record linkage i
2016-01-25 22:29:37 2577
转载 entity resolution
StanfordEntityResolution FrameworkOverviewPapersSoftwarePeopleNewsJan. 2012: Our paper on Pay-As-You-Go ER [11] has been accepted to the IEEE Transact
2016-01-24 22:52:59 1591
转载 穷人的语义处理工具箱之一:语义版Jaccard
|为什么我们是ML界的穷人如果对工业界里的机器学习(ML)从业者进行阶级划分的话,划线标准不是你用的算法的学名听起来多酷炫,无论你手里抡着的是最潮的深度高达1000层的深度学习核炸弹,还是听起来有点掉渣的大刀长矛朴素贝叶斯,如果没有大量数据,尤其是能跑监督学习算法的带标签训练数据,你就是ML界标准的底层渣男渣女或者渣娘炮。再加上计算资源,如果贵公司有上千台GPU服务器集群可供阁
2016-01-13 00:01:13 591 1
转载 Dubbo 简介
Dubbo是一个分布式服务框架,致力于提供高性能和透明化的RPC远程服务调用方案,以及SOA服务治理方案。简单的说,dubbo就是个服务框架,如果没有分布式的需求,其实是不需要用的,只有在分布式的时候,才有dubbo这样的分布式服务框架的需求,并且本质上是个服务调用的东东,说白了就是个远程服务调用的分布式框架(告别Web Service模式中的WSdl,以服务者与消费者的方式在dubbo上注册
2016-01-10 21:52:03 709
转载 中文文本处理简要介绍
本文作者李绳,博客地址 http://acepor.github.io/。作者自述:一位文科生曾励志成为语言学家出国后阴差阳错成了博士候选人三年后交完论文对学术彻底失望回国后误打误撞成了数据科学家作为一个处理自然语言数据的团队,我们在日常工作中要用到不同的工具来预处理中文文本,比如 Jieba 和 Stanford NLP software。出于准确性和效率的考
2016-01-08 15:31:27 619
转载 实战中的 Promise 和 Future
上一章介绍了 Future 类型,以及如何用它来编写高可读性、高组合性的异步执行代码。Future 只是整个谜团的一部分: 它是一个只读类型,允许你使用它计算得到的值,或者处理计算中出现的错误。 但是在这之前,必须得有一种方法把这个值放进去。 这一章里,你将会看到如何通过 Promise 类型来达到这个目的。类型 Promise之前,我们把一段顺序执行的代码块传递给了 scala.co
2016-01-06 20:04:53 1297
转载 sbt 编译spark 的wordcount 程序
直接执行 sbt 会在当前目录下面创建 target 目录sbt 的目录格局一般为 lib/ (该目录下存储与编译相关的 jar 文件) project/ src/main/scala/ src/main/test/scala复制 jar 文件 spark-assembly *hadoop2.5.1.jar 到 lib 目录下[root@localhost wo
2016-01-06 19:34:51 939
转载 SBT-Simple Build Tool入门
sbt的源文件目录结构sbt的命令行模式配置文件 .sbt.sbt vs .scala 构建语句定义什么是构建语句?如何定义 build.sbt 配置项配置项之间必须用空行分割Keys类型内建 Keys自定义 Keys任务Keys 和 配置 Keys定义 task 和 settings任务和配置项的类型Keys 在 sbt 的交互模式在
2016-01-06 19:30:21 903
转载 hive tez-use
文章目录1. DAG task git获取源码 一、安装必要软件1. 1、安装java2. 2、安装apache maven3. 3、Protocol Buffers 2.5.04. 4、编译tez5. github获取某个release版本6. 5、 change hadoop-version为你的版本6.1. Build tez 二、tez install
2016-01-06 00:32:25 2945
转载 Apache Tez:一个运行在YARN之上支持DAG作业的计算框架
【Apache Tez是什么?】Tez(Hortonworks介绍:这里,源代码下载:这里,今天刚刚发布的源代码)是Apache最新开源的支持DAG作业的计算框架,它直接源于MapReduce框架,核心思想是将Map和Reduce两个操作进一步拆分,即Map被拆分成Input、Processor、Sort、Merge和Output, Reduce被拆分成Input、Shuffl
2016-01-05 22:19:17 2239
转载 MySQL 去除字段中的换行和回车符
UPDATE SMS_PROVINCE SET PROVINCENAME = REPLACE(REPLACE(PROVINCENAME, CHAR(10),''), CHAR(13),'');环境: RHEL5+MySQL解决方法:UPDATE tablename SET field = REPLACE(REPLACE(field, CHAR(10), ”), CHAR(
2016-01-05 20:29:35 3294
httpclient tutorial httpclient 指南
2018-03-08
mask rcnn paper
2018-03-07
Applying Deep Learning To Answer Selection
2018-03-07
Learning Phrase Representations using RNN Encoder–Decoder
2018-03-07
BPTT BackPropagation Through Time.pdf
2018-03-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人