达观数据

文本智能处理专家

  • 博客(53)
  • 资源 (7)
  • 收藏
  • 关注

原创 【知识图谱直播预告】如何构建金融行业的知识图谱?

金融行业的核心竞争力之一就是信息的深度利用。在过去数十年,各类金融机构在信息的收集和处理方面做了大量的工作,积累了巨量的结构化和非结构化数据。知识图谱作为人工智能的关键技术之一,在近几年也被大量引入到金融信息处理方面,来实现深层次的和认知型的信息处理、挖掘与建模。那么,如何利用知识图谱技术来赋能金融机构对信息的利用呢?9月17日晚7点,达观数据副总裁王文广将通过直播,分享金融知识图谱如何构建和应用实践,解析如何从结构化数据和非结构化数据构建知识图谱,并通过具体的应用场景解析知识图谱在金融领域的应用实践.

2020-09-17 15:05:50 94

原创 同济大学王昊奋:知识图谱在多模态大数据时代的创新和实践 | 世界人工智能大会达观数据论坛

在2020年世界人工智能大会云端峰会中,达观数据与浦东青联联合举办了“智能时代,语你同行”行业论坛,围绕语言智能,在云端与多位行业专家与学者展开了一场精彩线上交流盛宴。同济大学特聘研究员王昊奋教授围绕知识图谱详细介绍了多模态知识图谱的构建、以及大规模知识推理、多策略知识问答等关键技术,并就行业知识图谱在金融、工业互联网、泛传媒、抗疫等领域的实践进行了详细介绍。以下为演讲内容:大家好!非常荣幸受邀来到2020年世界人工智能大会由达观数据主办的智能时代 “语”你同行的云端高峰论坛。在经历了互联网

2020-08-03 17:02:04 287

原创 2020世界人工智能大会云端开播!达观数据与浦东青联携手海内外大咖“语”你同行

备受业界关注的“2020世界人工智能大会云端峰会”7月9日云端拉开帷幕。本届大会采用线上活动为主的形式,突破“面对面”的地域限制,实现“屏对屏”的互动交流。国内语言智能领军企业达观数据携手浦东青年联合会联合主办了“智能时代,语你同行”主题论坛,围绕办公智能自动化相关的技术,和众多国际人工智能大咖探讨前沿技术及产业发展,呈现了一场精彩的语言智能交流盛宴。点击这里回看精彩分享浦东新区副区长管小军,浦东新区团委书记、浦东新区青联主席林廷钧与大家相聚云端,并就本次活动进行致辞。浦东新区副区长.

2020-07-10 18:31:10 453

原创 世界人工智能大会开幕倒计时!达观数据-“智能时代,‘语’你同行”行业论坛抢先注册!

2020年世界人工智能大会已进入倒计时阶段,由达观数据携手浦东青联联合主办的“智能时代,语你同行”行业论坛7月10日上午将携手8位嘉宾,与大家相聚云端,共话语言智能与办公机器人的未来发展。论坛议程论坛亮点抢先看亮点1:全面洞见产业未来本届论坛邀请到浦东新区副区长管小军、浦东新区团委书记浦东新区青联主席林廷钧作客论坛并致辞。同时论坛也邀请到深圳证券交易所总工程师喻华丽、平安金服智能客服及创新应用部总经理余伟,上海科大讯飞副总经理邵文明结合具体行业应用,洞见产业未来。亮.

2020-07-06 16:53:27 290

原创 达观杯携手CCKS,基于本体的金融知识图谱自动化构建技术评测开启报名

​​作为国内知名算法大赛,“达观杯”已经连续举办三届,分别以备受关注的“个性化推荐“、“文本分类”、“智能信息抽取”作为赛事主题,吸引了全球近万名NLP爱好者的关注和参与。在达观杯第四年之季,主办方达观数据将携手国内年度学术大会CCKS(全国知识图谱与语义计算大会),围绕“基于本体的金融知识图谱自动化构建”这一主题,继续和广大技术爱好者们探索NLP前沿技术的产业应用效果。​任务背...

2020-04-13 14:24:55 289

原创 达观数据:怎样评价推荐系统的结果质量?

推荐系统是互联网发展至今最常见也重要的技术之一。如今各类APP、网站、小程序等所有提供内容的地方,背后都有推荐系统在发挥作用。开发好一套真正优秀的推荐系统非常有价值,但也非常艰巨。达观数据是国内推荐系统主要第三方供应商,一直在摸索中前进。在想办法开发出强大的推荐系统服务好客户时,也一直在思考推荐系统的评估方法。众所周知业界有一句俗话:“没有评价就没有进步”,其意思是如果没有一套科学的评价推...

2020-04-01 19:23:50 379

原创 通过文本挖掘,我们发现了国家公务员考试的这些秘密

据中国新闻网报道,2020年度中央机关及其直属机构公务员招考笔试有超143万人报名,涉及中央和国家机关86个单位、23个直属机构,而计划招录2.4万人,通过资格审查人数与录用计划数之比约为60:1,在报名期间出现多个竞争超“千里挑一”的职位也就不足为奇了。虽然笔者没参加过国家公务员考试(以下简称“国考”),但本着“内行看门道,外行看热闹”的心态,笔者想一个旁观者的视角,通过一些语义分析技术去发...

2019-11-29 18:55:37 313 1

原创 LTR那点事—AUC及其与线上点击率的关联详解

LTR(Learning To Rank)学习排序是一种监督学习(SupervisedLearning)的排序方法,现已经广泛应用于信息索引,内容推荐,自然语言处理等多个领域。以推荐系统为例,推荐一般使用多个子策略,但哪个策略更好?每个策略选出多少候选集?每个候选集呈现的顺序如何排序?这些问题只能根据经验进行选择,随着策略越来越多,上述问题对推荐效果的影响会越来越大。于是乎,人们很自然的想到了用机...

2019-10-14 11:30:31 345

原创 掌握动态规划,助你成为优秀的算法工程师

1.导论相信很多同学已经在为今年的校招做准备了,随着AI的火热,越来越多的同学涌入了算法的行当之中。那去年校招的算法岗是有多火热?在知乎上看到这么一条帖子,先不说内容哈,足足400w+的阅读量啊。不光是计算机或软件专业的学生,很多电子,通信,自动化等相关专业的同学也吸引了进来。当然,这应该是件好事。但是相当一部分同学,在学习的过程中,尤其是刚入门的时候,可能会有这样一个疑问:算法工程师...

2019-09-29 18:07:55 142

原创 达观数据与华南师范大学产学研合作论文被物联网领域顶级期刊IEEE IOT录用

达观数据与华南师范大学认知与智能信息处理实验室首篇产学研合作论文“An Efficient Passenger-Hunting Recommendation Framework with Multi-Task Deep Learning”被‍物联网领域顶级期刊IEEE Internet of Things Journal录用。目前该论文的研究成果正与智能交通领域的企业商谈应用和...

2019-08-23 11:27:45 377

原创 破解 RPA的 5 大迷思

任何新事物在刚刚起步时都难以避免被误读,新接触RPA(机器人流程自动化)概念时,我们时常碰到一些迷思。人们可能会认为RPA将抢走人类的工作,它无所不能。但事实是这样的吗?迷思 1:RPA机器人是人形的尽管RPA(机器人流程自动化)的名称里有“机器人”三个字,这并不意味着它涉及到实体的器械。事实上,这类“机器人”只是一种软件,它模拟人类操作执行人机交互行为,作为虚拟劳动力协助我...

2019-08-19 11:59:42 275

原创 达观数据CTO纪达麒:小标注数据量下自然语言处理实战经验

自然语言处理在文本信息抽取、自动审校、智能问答、情感分析等场景下都有非常多的实际应用需求,在人工智能领域里有极为广泛的应用场景。然而在实际工程应用中,最经常面临的挑战是我们往往很难有大量高质量的标注语料。“巧妇难为无米之炊”,在缺少语料的情况下,如何达到良好的NLP应用效果,是这些场景要落地所必须解决的问题。我们通常称其为“低资源问题”,或者称为“小样本学习”问题,本文从达观数据的实践经...

2019-08-16 14:25:35 259

原创 银行流程自动化,达观RPA大显身手的十大场景

机器人流程自动化(RPA)是以自动化软件作为虚拟劳动力,依据预先设定的程序与现有系统进行交互并完成预期的任务。银行作为一个强规则领域,业务流程和报告流程的重复性强,规则明确,因此也最易于实现流程自动化;同时,由于RPA还有具有可追溯记录的属性,在合规上具有特别的优势。融合OCR和NLP智能模块的达观RPA机器人可以具备更高级别的计算机视觉和语义处理能力,不但可以登陆程序,移动文件,读写...

2019-08-16 11:39:15 501

原创 “达观杯”进行时 | 万字长文详解“智能文本抽取”算法进阶与应用

导读:本文整理自达观数据联合创始人高翔 7 月 11 日的直播公开课——《智能文本信息抽取算法的进阶和应用》。本文重点总结了文本信息抽取的传统和前沿算法应用,以及如何把这些方法应用到“达观杯”文本智能信息抽取挑战赛中。

2019-07-29 18:54:52 301

原创 第三届“达观杯”文本智能信息抽取挑战赛强势来袭,奖金 Offer你想要的都在这里!

“达观杯”是由达观数据主办的全国前沿人工智能和大数据技术竞赛,面向全国数百所高等院校本科及以上学生、大型科技企业和初创科技企业研发人员及各行业数据工作者、爱好者展开,意在发现更多技术人才,共同在NLP应用系统的开发实现突破,促进人工智能产业发展。自 2017 年“达观杯”算法挑战赛开始以来,两年的时间在NLP 的技术圈吸引了近万名技术爱好者,选手们在比赛拿奖后申请到了TOP海外高校,收获了心仪...

2019-07-17 14:43:10 268

翻译 达观数据:Angular 6+依赖注入使用指南:providedIn与providers对比

本文由达观数据研究院根据《Total Guide To Angular 6+ Dependency Injection — providedIn vs providers》编译,如有不当,还请指正。Angular 6为我们提供了更好的语法——provideIn,用于将服务注册到Angular依赖注入机制中。然而,新语法带来了非常多使用上的困惑,在GitHub评论,Slack和Stac...

2019-06-17 14:03:34 738

原创 达观数据:数据不够?GAN来凑!

大名鼎鼎的深度学习之父Yann LeCun曾评价GAN是“20年来机器学习领域最酷的想法”。的确,GAN向世人展示了从无到有、无中生有的神奇过程,并且GAN已经在工业界有着广泛的应用,是一项令人非常激动的AI技术。今天我将和大家一起去了解GAN及其内部工作原理,洞开GAN的大门。本文尽量用浅显易懂的语言来进行表述,少用繁琐的数学公式,并对几个典型的GAN模型进行讲解。一、GAN(Gen...

2019-06-13 18:20:32 1134

原创 达观数据:Selenium使用技巧与机器人流程自动化实战

背景北京时间晚上十一点,突然电脑右下角的QQ弹出了一条消息,"在?"都9012年了还会有人单独发个"在"然后人就失踪了?有事情找就直接说事情嘛,你不说事情,我怎么知道我应该"在"还是应该"不在"呢?鼠标移动到右下角准备点击"取消闪烁"时发现,是小美。感觉空气中突然弥漫着一种说不明的东西,还是忍不住回复了一句,"在,什么事情?""你明天下午一点方便使用电脑吗?"唉,有什么...

2019-06-10 16:49:20 2262

原创 达观数据:计算广告系统算法与架构综述

前言我们当今身处一个被广告包围的时代,无论是走在马路上、收看电视剧、或者是玩手机游戏,都能看见形形色色的广告。随着时代和技术的发展,广告的形式呈现出多样化、立体化的趋势,从最早的纸媒广告发展到如今的网页的展示、搜索广告,广告的定位也从原先的“广而告之”发展成大数据时代的“精准营销”,相应地,人们对广告的态度也在悄然变化。这一切都得益于互联网技术的快速发展以及用户数据的爆炸式增长。作为IT从...

2019-04-01 17:03:39 641

原创 达观数据:中文和英文语言差异和计算机处理的区别

关于作者陈运文:达观数据创始人,复旦大学计算机博士,科技部“万人计划”专家,国际计算机学会(ACM)、电子电器工程师学会(IEEE)、中国计算机学会(CCF)、中国人工智能学会(CAAI)高级会员;第九届上海青年科技英才。在人工智能领域拥有丰富研究成果,是复旦大学、上海财经大学聘任的校外研究生导师,在IEEE Transactions、SIGKDD等国际顶级学术期刊和会议上发表数十篇高水平科...

2019-03-20 14:00:50 893

原创 达观数据:用好学习排序 (LTR) ,资讯信息流推荐效果翻倍

序言达观数据是一家基于文本语义理解为企业提供自动抽取、审核、纠错、推荐、搜索、写作等系统服务的人工智能企业,其中在推荐场景上我们也服务了很多客户企业,客户在要求推荐服务稳定、需求响应及时的基础上,对系统的效果也提出了越来越高的期望,这对算法团队也是一个挑战。本文将从资讯信息流这个场景入手,先简单介绍达观推荐引擎的架构演化,同时尽可能详细的介绍学习排序这个核心技术的实践和落地经验。达观推...

2019-03-05 18:47:41 1560

原创 达观数据刘思乡:一文详解AlphaGo原理

摘要1、围棋是一个MDPs问题2、policy iteration如何求解MDPs问题?3、WHAT and WHY is MonteCarlo method?4、AlphaGo Zero的强化学习算法前言AlphaGo是GoogleDeepMind团队开发的一个基于深度神经网络的围棋人工智能程序,其一共经历了以下几次迭代[1]:马尔可夫决策过程一个马尔...

2019-01-30 10:47:49 318

原创 达观数据郭权:用好ngResource和postman,提高你的开发调试效率

本文将主要从angularjs下Resource与RESTful 接口初探,和调试工具postman的使用介绍这两个方面,和大家分享方便开发与维护的技巧工具。如有不当之处,还请交流指正。技巧1:减少开发与运维难度,angularjs下Resource与RESTful 接口初探现代的项目中前端页面展现的数据多数是动态变化的,展示数据会涉及到网络请求,从后台拿取数据,前端进行展示。最初的是...

2019-01-28 10:12:44 131

原创 一文详解下一代web应用模型—PWA

去年apple在iOS11.3的正式更新中,添加了对service worker的支持。新的桌面版Safari会默认打开Service Worker。这意味着我们可以通过Safari将支持PWA的站点像原生app一样添加到桌面,并且支持在离线状态下访问。至此,Microsoft, Chrome, Apple这些浏览器大厂都已全部支持了PWA。本文将为大家介绍PWA的特点、技术核心、创建方法、在项目...

2019-01-23 16:13:59 169

原创 达观数据陈祥龙:集成学习算法(Ensemble Method)浅析

个性化推荐系统是达观数据在金融、电商、媒体、直播等行业的主要产品之一。在达观数据的个性化推荐系统架构中, 可以简单地分为5层架构,每层处理相应的数据输出给下一层使用,分别是:数据处理层 作为推荐系统最低端的数据处理层,主要功能是首先将客户上传上来的一些无用的噪声数据进行清理过滤,将推荐系统所需要用到的数据导入到数据存储层中;数据存储层 对于item的数据一般存入在Mysql中,随着数...

2018-12-28 15:08:00 217

原创 达观数据技术实践:知识图谱和Neo4j浅析

在当前大数据行业中, 随着算法的升级, 特别是机器学习的加入,“找规律”式的算法所带来的“红利”正在逐渐地消失,进而需要一种可以对数据进行更深一层挖掘的方式,这种新的方式就是知识图谱。下面我们来聊一下知识图谱以及知识图谱在达观数据中的实践。 NO.1 什么是知识图谱知识图谱(Knowledge Graph)是一种用点来代替实体,用边代替实体之间关系的一种语义网络。通俗来说,知识...

2018-12-11 11:49:31 540

原创 达观数据:kubernetes简介和实战

在本文中,我们从技术细节上对kubernetes进行简单运用介绍,利用一些yaml脚本层面上实例告诉大家kubernetes基本概念。Kubernetes以及它呈现出的编程范式值得你去使用和整合到自己的技术栈中。kubernetes简单介绍1 kubernetes起源Kubernetes最初认为是谷歌开源的容器集群管理系统,是Google多年大规模容器管理技术Borg或Omega的...

2018-12-04 19:03:22 219

原创 达观数据王江:fastText原理及实践

fastText是Facebook于2016年开源的一个词向量计算和文本分类工具,在学术上并没有太大创新。但是它的优点也非常明显,在文本分类任务中,fastText(浅层网络)往往能取得和深度网络相媲美的精度,却在训练时间上比深度网络快许多数量级。在标准的多核CPU上, 能够训练10亿词级别语料库的词向量在10分钟之内,能够分类有着30万多类别的50多万句子在1分钟之内。本文首先会介绍一些...

2018-12-03 11:28:13 239

原创 当知识图谱遇上文本智能处理,会擦出怎样的火花?

目前以理解人类语言为入口的认知智能成为了人工智能发展的突破点,而知识图谱则是迈向认知智能的关键要素。达观数据在2018AIIA人工智能开发者大会承办的语言认知智能与知识图谱公开课上,三位来自企业和学术领域的专家分别从不同角度讲述的知识图谱的应用和发展。文本根据达观数据副总裁王文广演讲内容《知识图谱与文本智能处理》整理所得,内容略有删减。人们一些模糊词义的表达,比如:以前没有钱买华为,现在没...

2018-11-28 23:26:23 1406

原创 达观数据特聘专家复旦大学黄萱菁教授带你了解自然语言理解中的表示学习

本文根据达观数据特聘专家复旦大学黄萱菁教授在达观数据举办的长三角人工智能应用创新张江峰会上的演讲整理而成,达观数据副总裁魏芳博士统稿一、概念1  什么是自然语言和自然语言理解?自然语言是指汉语、英语、德语、俄语等人们日常使用的语言,是自然而然的随着人类社会发展演变而来的语言,而不是人造的语言。我们平时说的口语还有书面语,这些都是自然语言,还有其他的语言,比如说手语等等。它区别于人...

2018-11-23 11:16:16 743

原创 达观数据:文字的起源与文本挖掘的前世今生

01 / 08、人类的文明,始于文字诞生。100万年前,古猿进化成人类。50万年前,人类学会使用火。5000年前,人类发明文字。文明并非从天而降,人类从蒙昧、野蛮步入文明,是个漫长而坎坷的过程。远古智人和禽兽并没有什么区别,和动物一样,只有一种把信息传递下去的方式:基因。文字诞生后,人类学会用字把信息保存下来,才逐渐脱离了动物状态。人们开始了解历史不同时期所发生的事。历史是前人走过...

2018-11-15 18:33:04 422

原创 如何做好文本关键词提取?从三种算法说起

在自然语言处理领域,处理海量的文本文件最关键的是要把用户最关心的问题提取出来。而无论是对于长文本还是短文本,往往可以通过几个关键词窥探整个文本的主题思想。与此同时,不管是基于文本的推荐还是基于文本的搜索,对于文本关键词的依赖也很大,关键词提取的准确程度直接关系到推荐系统或者搜索系统的最终效果。因此,关键词提取在文本挖掘领域是一个很重要的部分。关于文本的关键词提取方法分为有监督、半监督和无监...

2018-11-14 19:21:39 1230

原创 达观数据王文广:如何玩转自然语言理解和深度学习实践?

本文根据达观数据王文广在“达观杯”文本智能处理挑战赛期间的技术直播分享整理而成,内容略有删减。一、深度学习概述深度学习是从机器学习基础上发展起来的,机器学习分为监督学习、非监督学习以及强化学习三种类型。深度学习是在机器学习的基础上把特征抽取工作放到里面一起来完成的,直接实现了端到端的学习。通常我们遇到的深度网络包括:堆叠自编码器、深度信念网络、卷积神经网络和循环神经网络。下面左...

2018-10-30 18:30:06 400

原创 一入编码深似海,在达观数据做程序员是怎样一种体验?

在技术浪潮一波接一波推动人类社会前进的历史进程当中,程序员始终是站在浪尖的群体。2014年起,把每年10月24日(2^10)定义为程序员节。这可能是唯一一个与数字紧密相关的节日——也体现了这个节日的含义:数字、代码、简单。作为一家程序员占比60%以上的技术驱动公司,小编今天找了技术部几位小伙伴们,聊了聊他们对自身工作的认识与想法、在工作中的坚持与改变,包括但不限于:1.  如何走上了...

2018-10-24 23:18:30 271

原创 一文详解深度学习在命名实体识别(NER)中的应用

近几年来,基于神经网络的深度学习方法在计算机视觉、语音识别等领域取得了巨大成功,另外在自然语言处理领域也取得了不少进展。在NLP的关键性基础任务—命名实体识别(Named Entity Recognition,NER)的研究中,深度学习也获得了不错的效果。最近,笔者阅读了一系列基于深度学习的NER研究的相关论文,并将其应用到达观的NER基础模块中,在此进行一下总结,与大家一起分享学习。1、NE...

2018-10-23 18:50:38 2139 1

原创 达观数据王子豪:这5个例子,小学生都能秒懂分类算法

分类算法作为数据挖掘、机器学习中重要的研究领域,在新闻分类、黄反广告识别、情感分析、观点挖掘等应用实践中都有着广泛的应用。如何将朴素贝叶斯、决策树、支持向量机这些常见的分类算法通俗易懂地讲给对人工智能感兴趣的人?达观研究院的这篇分类算法科普文章,以日常生活为例子,让小学生都能秒懂分类算法。试想,8岁的小明是你刚上小学的儿子,长得可爱,古灵精怪,对世界充满好奇。这天饭后,刚写完家庭作...

2018-10-19 14:11:26 393 1

原创 如何省时省力验证模型效果?达观数据在线分层实验平台给你支招

背景随着大数据和人工智能时代的到来,数据的驱动使得企业经营决策和精细化运营的效果指标的量化评估成为可能,企业的决策和运营也越来越离不开数据的支持。尤其是朝夕万变的互联网行业,产品创新和决策都需要快速得到用户反馈的数据去不断的迭代更新。 产品的新特性是否会受到用户的欢迎?新优化的模型和策略的线上效果如何?如何低成本的进行快速且量化的效果验证? 答案是A/B test实验。事实上,一个高效...

2018-10-16 11:23:54 343

原创 “达人”计划丨达观数据2019届校园招聘正式启动

一  Who we are 用理解分析情景用热诚驱动革新用AI开拓未来 为有志于在人工智能NLP领域发展的同学提供一条有趣、钱多、目标明确的赛道为客户提供文本智能处理解决方案以一流文本挖掘技术赋能企业转型在AI趋势中一起破浪前行!  二 招聘岗位1 AI算法工程师自然语言处理,搜索算法,推荐算法,计算机视觉。2 软...

2018-10-15 10:29:51 669

原创 达观数据曾彦能:如何用深度学习做好长文本分类与法律文书智能化处理

在NLP领域中,文本分类舆情分析等任务相较于文本抽取,和摘要等任务更容易获得大量标注数据。因此在文本分类领域中深度学习相较于传统方法更容易获得比较好的效果。正是有了文本分类模型的快速演进,海量的法律文书可以通过智能化处理来极大地提高效率。我们今天就来分析一下当前state of art的文本分类模型以及他们在法律文书智能化中的应用。 文本分类领域走过路过不可错过的深度学习模型主要有Fa...

2018-10-10 10:44:45 412

原创 达观数据于敬:深度学习来一波,受限玻尔兹曼机原理及在推荐系统中的应用

深度学习相关技术近年来在工程界可谓是风生水起,在自然语言处理、图像和视频识别等领域得到极其广泛的应用,并且在效果上更是碾压传统的机器学习。一方面相对传统的机器学习,深度学习使用更多的数据可以进行更好的扩展,并且具有非常优异的自动提取抽象特征的能力。另外得益于GPU、SSD存储、大容量RAM以及大数据分布式计算平台等的快速发展,海量数据的处理能力大幅度提升。同时,“千人千面”的个性化推荐系统...

2018-10-09 11:08:10 557

达观数据于敬:个性化推荐系统实践

本文从构建用户模型到个性化推荐,介绍了达观数据的一些实践经验。个性化推荐系统能有效解决信息过载和长尾物品两个方面的问题,不仅提供了极佳的用户体检,满足了用户的信息需求,也帮助了企业挖掘其中蕴含的无限商机。

2016-01-27

达观数据文辉:Hadoop和Hive使用经验

近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上的行业标准之一。面对当今互联网产生的巨大的TB甚至PB级原始数据,利用基于Hadoop的数据仓库解决方案Hive早已是Hadoop的热点应用之一。本文将从Hive的原理、架构及优化等方面来分享Hive的一些心得和使用经验,希望对大家有所收货。

2016-01-18

点击模型:达观数据提升算法精度的利器

达观数据在引擎架构研发实践中,大量使用到了点击模型,通过与用户的隐性交互,大幅提升了算法效果,积累了丰富的实战经验,特来分享。

2016-01-13

达观数据:文本大数据的机器学习自动分类方法

多年经验与业界人士分享如何对浩如烟海的数据进行分类、组织和管理。

2016-01-07

达观数据阐述推荐系统和搜索引擎的关系

从信息获取的角度来看,搜索和推荐是用户获取信息的两种主要手段。无论在互联网上,还是在线下的场景里,搜索和推荐这两种方式都大量并存,那么推荐系统和搜索引擎这两个系统到底有什么关系?区别和相似的地方有哪些?本文作者有幸同时具有搜索引擎和推荐系统一线的技术产品开发经验,结合自己的实践经验来为大家阐述两者之间的关系、分享自己的体会(达观数据陈运文博士)

2016-01-04

推荐系统和搜索引擎的关系达观陈运文

达观数据深入分析推荐系统和搜索引擎的关系,通过简单易懂的逻辑,更好的了解文章内容。

2015-12-29

机器学习技术在达观数据的实现

大数据时代里,互联网用户每天都会直接或间接使用到大数据技术的成果,直接面向用户的比如搜索引擎的排序结果,间接影响用户的比如网络游戏的流失用户预测、支付平台的欺诈交易监测等等。达观数据技术团队长期以来一直致力于钻研和积累各种大数据技术,曾获得cikm2014数据挖掘竞赛冠军,也开发过智能文本内容审核系统、作弊监测系统、用户建模系统等多个基于大数据技术的应用系统。

2015-12-22

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除