Ubuntu 16.04下安装MySQL

简单分享Ubuntu 16.04下安装MySQL的过程。 首先执行下面三条命令: sudo apt-get install mysql-server sudo apt isntall mysql-client sudo apt install libmysqlclient-dev 安装成...

2018-07-31 16:52:07

阅读数:41

评论数:0

####好好好好####基于Tacotron汉语语音合成的开源实践

  2017年初,Google 提出了一种新的端到端的语音合成系统——Tacotron。Tacotron打破了各个传统组件之间的壁垒,使得可以从<文本,声谱>配对的数据集上,完全随机从头开始训练。本文是来自喜马拉雅FM音视频工程师马力的投稿,他手...

2018-07-31 13:06:10

阅读数:326

评论数:0

微服务架构的六种模式

1.微服务架构模式方案 用Scale Cube方法设计应用架构,将应用服务按功能拆分成一组相互协作的服务。每个服务负责一组特定、相关的功能。每个服务可以有自己独立的数据库,从而保证与其他服务解耦。     1.1 聚合器微服务设计模式         聚合器调用多个服务实现应用程序所...

2018-07-30 19:25:06

阅读数:145

评论数:0

使用Spark进行微服务的实时性能分析

作为一种灵活性极强的构架风格,时下微服务在各种开发项目中日益普及。在这种架构中,应用程序被按照功能分解成一组松耦合的服务,它们通过REST APIs相互协作。通过这个设计原则,开发团队可以快速地不断迭代各个独立的微服务。同时,基于这些特性,很多机构可以数倍地提升自己的部署能力。 然而凡事都有两面...

2018-07-30 19:23:57

阅读数:60

评论数:0

python基础----特性(property)、静态方法(staticmethod)、类方法(classmethod)、__str__的用法

阅读目录 一、特性(property)                                                                          二、静态方法(staticmethod)                                  ...

2018-07-25 16:21:26

阅读数:129

评论数:0

官方教程:Apache Kylin和Superset集成,使用开源组件,完美打造OLAP系统

本文转自Apache Kylin公众号apachekylin. Superset 是一个数据探索和可视化平台,设计用来提供直观的,可视化的,交互式的分析体验。 Superset 提供了两种分析数据源的方式: 1. 用户可以以单表形式直接查询多种数据源,包括 Presto、Hive、Impal...

2018-07-25 16:15:00

阅读数:219

评论数:0

NLP最新迁移学习方法微调语言模型,可将误差减少超过20%

可以这样说,迁移学习已经促使计算机视觉领域发生了具有革命性的变化,但对于自然语言处理(NLP)中的现有方法来说,仍然需要从零开始对其进行针对于特定任务的修改和训练。我们提出了微调语言模型(Fine-tuned Language Models,FitLaM),这是一种有效的迁移学习方法,可以应用于N...

2018-07-23 16:22:05

阅读数:118

评论数:0

大数据用户画像方法与实践

在大数据时代,机器要学会从比特流中解读用户,构建用户画像就变得尤其重要。本文介绍了用户画像的理论和实践,以及在实际中的应用。如何根据用户画像进行精准营销?将用户画像应用于个性化推荐?一起来寻找答案吧~ 首先看一下大数据与应用画像的关系,现在大数据是炙手可热,相信大家对大数据的四个V都非常了解,大...

2018-07-18 14:53:38

阅读数:241

评论数:0

使用Azkaban调度Spark任务

概述为什么需要工作流调度系统l 一个完整的数据分析系统通常都是由大量任务单元组成:shell脚本程序,java程序,mapreduce程序、hive脚本等l 各任务单元之间存在时间先后及前后依赖关系l 为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行; 例如,我们可能有这样一个...

2018-07-13 13:20:29

阅读数:361

评论数:0

azkaban学习笔记总结

1. 任务调度概述一个完整的数据分析系统通常都是由大量任务单元组成:shell脚本程序,java程序,mapreduce程序、hive脚本等各任务单元之间存在时间先后及前后依赖关系现成的开源调度系统,比如ooize、azkaban。2. azkaban介绍Azkaban是由Linkedin开源的一...

2018-07-11 16:54:25

阅读数:96

评论数:0

在pyspark中调用scala代码

在pyspark中调用scala代码情境说明问题我们这边是要使用Spark去并行一个自然语言处理的算法,其中使用到了LDA主题模型。由于使用的是天河二号,Spark版本是1.5.1,pyspark同样,所以获取主题时还不能使用describeTopics(在spark1.6中才开放对python的...

2018-07-11 11:47:43

阅读数:108

评论数:0

AI领域真正最稀缺的人才是会庖丁解牛的那个人

图片来源:Wired这里,就不卖关子了。AI领域最最最最最稀缺的人才应该为人工智能架构师。有过4次技术创业经历,如今做AI投资的星瀚资本创始合伙人杨歌如是说。在杨歌的身上,传奇的经历多得是。清华学霸,技术男,四次技术创业经历,创建青年精英商业联合会,投身PE,创办星瀚资本,圈内最懂AI技术的投资人...

2018-07-04 02:24:49

阅读数:149

评论数:0

胶囊网络(Capsule Network)的TensorFlow实现

现在我们都知道Geoffrey Hinton的胶囊网络(Capsule Network)震动了整个人工智能领域,它将卷积神经网络(CNN)的极限推到一个新的水平。 网上已经有很多的帖子、文章和研究论文在探讨胶囊网络理论,以及它如何做的比传统的CNN更好。因此我不打算介绍这方面的内容,而是尝试使用谷...

2018-07-04 01:43:06

阅读数:132

评论数:0

深度学习在美团搜索广告排序的应用实践

一、前言在计算广告场景中,需要平衡和优化三个参与方——用户、广告主、平台的关键指标,而预估点击率CTR(Click-through Rate)和转化率CVR(Conversion Rate)是其中非常重要的一环,准确地预估CTR和CVR对于提高流量变现效率,提升广告主ROI(Return on I...

2018-07-03 14:53:08

阅读数:92

评论数:0

工作中如何做好技术积累

引言古人云:“活到老,学到老。”互联网算是最辛苦的行业之一,“加班”对工程师来说已是“家常便饭”,同时互联网技术又日新月异,很多工程师都疲于应付,叫苦不堪。以至于长期以来流传一个很广的误解:35岁是程序员工作的终点。如何在繁忙的工作中做好技术积累,构建个人核心竞争力,相信是很多工程师同行都在思考的...

2018-07-03 11:24:15

阅读数:85

评论数:0

使用TensorFlow训练WDL模型性能问题定位与调优

简介TensorFlow是Google研发的第二代人工智能学习系统,能够处理多种深度学习算法模型,以功能强大和高可扩展性而著称。TensorFlow完全开源,所以很多公司都在使用,但是美团点评在使用分布式TensorFlow训练WDL模型时,发现训练速度很慢,难以满足业务需求。经过对TensorF...

2018-07-03 10:33:05

阅读数:117

评论数:0

python:让源码更安全之将py编译成so

python:让源码更安全之将py编译成so应用场景  Python是一种面向对象的解释型计算机程序设计语言,具有丰富和强大的库,使用其开发产品快速高效。  python的解释特性是将py编译为独有的二进制编码pyc文件,然后对pyc中的指令进行解释执行,但是pyc的反编译却非常简单,可直接反编译...

2018-07-01 22:46:57

阅读数:105

评论数:0

深入理解 GIL:如何写出高性能及线程安全的 Python 代码

6岁时,我有一个音乐盒。我上紧发条,音乐盒顶上的芭蕾舞女演员就会旋转起来,同时,内部装置发出“一闪一闪亮晶晶,满天都是小星星”的叮铃声。那玩意儿肯定俗气透了,但我喜欢那个音乐盒,我想知道它的工作原理是什么。后来我拆开了,才看到它里面一个简单的装置,机身内部镶嵌着一个拇指大小的金属圆筒,当它转动时会...

2018-07-01 22:45:12

阅读数:58

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭