自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 统计与机器学习

2020-03-05 17:19:48

阅读数 40

评论数 0

原创 《关键对话——从“心”开始,如何确定目标》读书笔记(三)

从“心”开始,如何确定目标、 我们的问题并不是行为本身是错误的,而是我们的动机有问题,即我们常常弄错要面对的目标。 一、从心开始 对话高手总是能做到从心开始。在开展高风险对话时,他们总是首先明确目的和动机,无论出现什么情况,这个目的都不会动摇。 他们对目标的关注表现在两个方面: 他们非常清楚...

2019-12-21 08:50:48

阅读数 29

评论数 0

原创 信息流推荐多样性

信息流推荐多样性 一、问题现状 信息流产品中一个常见的问题是多样性越来越差,造成这种问题的原因在于机器学习算法本身。下面通过一副系统循环图来介绍多样性差的问题。 资讯库随机推荐文章,由于是按照全库比例采样,娱乐占比较大,随机推荐给用户的娱乐资讯偏多。 用户点击娱乐的概率变大,算法根据用户的反...

2019-12-03 21:17:19

阅读数 40

评论数 0

原创 《关键对话——掌握关键对话》读书笔记(二)

《关键对话——如何高效能沟通》读书笔记(二) 上一节中我们已经定义了关键对话,在面对关键对话时(比如老板给你安排了一项非常不合适的任务),你的选择可能只有如下两种: 1.当面表示反对,把老板惹怒 2.沉默接受错误决定,不管公司是否因此遭殃 在关键对话的场景中,我们应该尽量做到坦诚和尊重对方。这...

2019-11-30 21:51:06

阅读数 97

评论数 0

转载 推荐算法工程师的成长之道

推荐算法工程师的成长之道 原创: gongyouliu 大数据与人工智能 3月20日 源链接:原文地址 本文,作者会基于自己的实践经验讲述推荐算法工程师的成长之道,这里的“道”有发展路径和道(道理、方法论、经验、智慧)两层意思。 所以本文除了讲解推荐算法工程师的成长路径之外,还会详细阐...

2019-10-23 09:31:57

阅读数 488

评论数 1

原创 《关键对话——何谓关键对话》读书笔记(一)

《关键对话——如何高效能沟通》读书笔记(一) 利用假期的时间,将关键对话阅读了一遍,书中提到的观点,方法,场景等很适合我目前处的状态,有的时候读起来仿佛就是自己声临其境,有种感同身受的状态。书中最有价值的地方就是教你处理不同场景下对话的思路和方法,很有实际的利用价值。同时也丰富了自己在职场、生活...

2019-10-08 20:42:23

阅读数 71

评论数 0

原创 如何达成目标笔记

如何达成目标 一、本书主要内容 推荐序一 升级你的行动工具箱 推荐序二 人们可以改变 引言 成功者和自制力的悖论 //004 自制力到底是怎样的 //007 你能做什么 //009 本书的主题 //011 1.1 准备就绪 第1章 你明白自己去往哪里吗 别说“做到最好” //017 大局与细节 /...

2019-09-30 14:50:09

阅读数 17

评论数 0

原创 蒙特卡罗方法介绍( 二)

蒙特卡罗方法介绍( 二) 一、蒙特卡罗求解定积分 蒙特卡洛方法求解定积分有两种方法,一种是上一节中讲的投点法,另外一种是期望法(也称平均值法)。 1.1 投点法 给出如下曲线f(x)f(x)f(x),求f(x)f(x)f(x)在a,ba,ba,b上的积分,即xxx在a,ba,ba,b上与曲...

2019-09-30 10:53:55

阅读数 184

评论数 0

转载 NLP技术路线详解:这是从数学到算法的艺术

nlp-roadmap nlp-roadmap is Natural Language Processing ROADMAP(Mind Map) and KEYWORD for students those who have interest in learning Natural Langu...

2019-09-27 11:30:50

阅读数 26

评论数 0

转载 神策数据张涛:如何让用户标签价值落地?

原文链接:https://blog.csdn.net/sensorsdata/article/details/92841022 本文根据神策数据副总裁张涛在《用户个性化运营—标签体系搭建新机遇》主题沙龙中演讲整理所得。 标签系统,在企业中已不是什么“高大上”的说辞。然而让用户标签价值真正落地企...

2019-09-27 09:37:34

阅读数 17

评论数 0

原创 蒙特卡罗方法介绍(一)

蒙特卡罗方法介绍(一) 一、蒙特卡罗方法的基本思想和解题步骤 1.1 蒙特卡罗方法的基本思想 蒙特卡罗方法也称随机模拟法、随机抽样技术或统计实验发,其基本思想是:为了求解数学、物理、工程技术或生产管理等方面的问题。首先,建立一个与求解有关的概率模型或随机过程,使他的参数等于所求问题的解;然后通过对...

2019-09-24 10:16:35

阅读数 429

评论数 0

原创 高效管理读书笔记

高效管理读书笔记一、优秀的权威宣言二、主要的内容要点2.1 有权威的领导都会关心自己的员工2.2 问责而不指责2.3 多点尤达,少点超人三、原书 一、优秀的权威宣言 优秀的权威就是: 指出大部分人视而不见的问题的气质 今天畅所欲言而不是空等明天的好心【今天有什么说什么,而不是沉默等待】 会见每一...

2019-09-15 08:24:40

阅读数 213

评论数 0

原创 管理机器学习项目

管理机器学习项目 一. 目录 传统的软件项目管理 目前的现状 机器学习项目管理 二、传统的软件项目管理 传统的软件项目管理和开发流程已经非常成熟。大致的流程如下: 由运营、产品进行最初的功能策划,进行可行性分析 由项目经理召集相关人员进行产品启动会,确定产品运营、开发、...

2019-09-12 14:47:28

阅读数 37

评论数 0

原创 项目过程管理

项目过程管理 1. 项目所需要的文档(需要归档) 需求文档(需求评审时的问题列表) 技术文档(技术评审时的问题列表) 排期文档 开发文档(记录开发过程中遇到的难题和解决方案) 测试文档(测试提供UT报告和压测报告) 风险点(列出项目风险点并做好预案) 上线时的checklist 算法/服务维护列...

2019-09-12 14:39:10

阅读数 40

评论数 0

转载 [科研笔记] 关于人工智能与算法项目的思考

原链接:https://blog.csdn.net/walilk/article/details/77131929 前言   [科研笔记] 系列是我在科研道路上的随笔和思考,内容不加以局限,是一个开放的文章系列,这也是给自己一点自由的空间。      本文是我结合自身经验给的一些出关于人工...

2019-09-06 16:36:35

阅读数 62

评论数 0

原创 管理学习(2)——职场中最重要的四件事

职场中最重要的四件事 职场的核心精髓可以概括为职场中最重要的三件事,它们分别是:职场第一要务、职业化、职场的本质。 1.这三件事与身处职场的我们到底有什么关系呢? 就让我用三句话概括一下: 职场第一要务决定了我们在职场上的生死存亡; 职业化关系到我们在职场上所受的多方评价; 对职场本质的理解...

2019-01-16 09:05:42

阅读数 228

评论数 0

原创 管理学习笔记(1)——高效团队的五大关键

高效团队的五大关键 1. 安全感:敢于冒险,不会因此干到不安 2. 可靠性:指望他人可以准时完成高质量的工作 3. 结构与清晰度:目标、角色和执行计划都很清楚、明确 4. 工作意义:对各自来说做意义重大的工作 5. 工作影响: 我们认为自己的工作重要吗? ...

2019-01-16 08:50:00

阅读数 175

评论数 0

转载 什么样的知识,值得我们终生学习

什么样的知识,值得我们终生学习? 原文:https://dwz.cn/vylyXXJi 一、引言 可能你从初中就开始抱怨:我学相似三角形能干什么?阿伏伽德罗常数有什么用?我一不跳楼,二不高空抛物,学自由落体用来干啥?可高考是我们大多数人需要经历的过程,我们...

2019-01-15 13:09:04

阅读数 465

评论数 0

原创 Big GAN

参考文献: •https://github.com/kayamin/DR-GAN •https://www.jianshu.com/p/4ee8f9284b81 •http://cvlab.cse.m...

2018-12-06 14:01:17

阅读数 554

评论数 0

原创 NLP 最新进展

  参考文献: •http://www.dataguru.cn/article-14237-1.html •https://zhuanlan.zhihu.com/p/46652512 •https://github...

2018-12-06 13:56:17

阅读数 444

评论数 0

原创 领导者的资质——学习笔记(3):领导者的十项职责

领导者的资质——学习笔记(3):领导者的十项职责 领导者必须向员工说明工作的目的意义,设定具体目标,制定相应的计划,怀着强烈的愿望,付出不亚于任何人的努力,表现出坚强的意志,决不放弃,磨练自己的人格,关爱员工,调动他们的积极性,共同致力于创新。 1. 明确事业的目的意义,并向部下指明 要明确...

2018-11-14 22:47:33

阅读数 686

评论数 0

原创 领导者的资质——学习笔记(2):领导者的人格

领导者的资质——学习笔记(2):领导者的人格 在领导者的资质中,人格最为重要。领导者保持自己高层次的人格,是解决当前企业治理危机最根本性的方略。我们要时时事事思考“作为人,何为正确”不断自问自答,不懈努力,去“提升自己的人格”,“提升自己的心性”,“拓展公司的经营”。 1. 企业治理的危机和...

2018-11-10 20:16:14

阅读数 433

评论数 0

原创 领导者的资质——学习笔记(1)

领导者的资质——学习笔记(1) 《领导者的资质》是稻盛和夫先生著作的一本书,书中的道理值得深深思考和体会,结合自己工作、生活中的一些事情,会有不同的感觉。本学习笔记特此记录书中重点的内容,供以后反复阅读。 第一项资质:具备使命感 要率领团队前进,开始只是强烈的愿望也无妨。但我认为,同时大义...

2018-11-05 23:07:08

阅读数 629

评论数 0

转载 NLP的游戏规则从此改写?从word2vec, ELMo到BERT

NLP的游戏规则从此改写?从word2vec, ELMo到BERT 2018-10-24 10:20| 发布者: 炼数成金_小数| 查看: 6920| 评论: 0|原作者: 夕小瑶|来自: 夕小瑶的卖萌屋 http://www.dataguru.cn/article-14237-1.html ...

2018-11-02 19:33:55

阅读数 2167

评论数 0

原创 程序员健身的重要性

程序员健身的重要性 人的身体就是人的灵魂最好的写照! --- 路德维系.维特根斯坦 健身不仅是保持健康体魄的关键要素之一,也是灵活的、具有创造性的脑力活动的基础。 --- 约翰.肯尼迪 一. 为什么我们除了写代码,还要健身? 相信大家都看过不少的程序员猝死的新闻,原因就是过劳,身体虚...

2018-10-31 18:22:13

阅读数 435

评论数 0

转载 自燃型员工的特点

自然型员工的特点 原文:https://mp.weixin.qq.com/s/SaQ_GG7CpPqdGc_l5jffag 稻盛和夫曾经说过,人分为三种: 一种是自燃型,自我驱动,自我燃烧; 第二种是点燃型,需要别人在背后推一把; 第三种是阻燃型,怎么点都点不着。 自燃...

2018-10-25 10:33:07

阅读数 908

评论数 0

原创 推荐系统整体框架概览

推荐系统整体框架概览 推荐系统整体架构 推荐系统的核心组成部分离线核心节点服务UI 总结 推荐系统整体架构 先说点题外话,最近在看的书中讲到了怎么进行自学的方法,分了十个层级。第一个便是要了解所学内容的概况,也就是轮廓,大的东西是什么,方向是什么。所以,专栏的主要内容就是推荐系统,那么首先来看看...

2018-10-18 20:00:25

阅读数 589

评论数 0

转载 关于管理,这5大误区你越早知道越好

关于管理,这5大误区你越早知道越好 原创: 陈春花 管理的常识 5天前 绝大部分人都感觉自己已经非常努力地工作,但结果却不尽如人意,到底问题出在哪里? 就让北京大学国家发展研究院管理学教授、北大国发院BiMBA商学院院长陈春花老师为你答疑解惑吧! 常识君|有话说 我们都知道,管理实际...

2018-10-16 12:59:17

阅读数 264

评论数 0

原创 搭建推荐系统所需要的材料

搭建推荐系统所需要的材料人力物力推荐系统的原材料物品流量最后 人力物力 在上一小节中《推荐系统的必要性》里已经讨论过一个推荐业务团队需要哪些人员储备,需要什么核心技术等。这里在重点说下物力,即机器资源设备。 往往从头开始搭建这样一个团队,的确是比较花时间,金钱,人工的。 第一,人员的招聘是...

2018-10-13 11:06:19

阅读数 557

评论数 0

原创 推荐系统的必要性

推荐系统的必要性引言回顾你需要推荐系统吗?怎么做? 引言回顾 在专栏文章的引言中,我们讨论了推荐和推荐系统,以及推荐系统的应用。这里我感觉有必要再通俗地介绍下推荐系统。我们所存在的世界是不断发展的,发展是靠着越来越多的连接来进行的。从最原始的物物交换,到今天世界各国建立贸易关系,都是为了自身的...

2018-10-11 20:02:46

阅读数 2022

评论数 0

原创 引言

推荐系统从0到1_引言什么是推荐?什么是推荐系统?推荐系统的应用 什么是推荐? 说起推荐,就不得不说搜索。搜索这里指信息检索,在大量的信息中,我们需要找到自己需要的信息,就用到了搜索引擎,它帮助我们更快地找到有价值的信息。如google,baidu等等,还有其他专业的信息检索网站,如我常用的D...

2018-10-09 19:43:15

阅读数 294

评论数 0

原创 推荐系统从0到1_1

推荐系统从0到1_1目录结构引言推荐系统的必要性搭建推荐系统所需要的材料推荐系统整体框架概览推荐系统核心技术框架数据预处理EE问题和相关算法TopN推荐CF算法原理介绍和实现基于用户行为的个性化推荐Word2Vec介绍和应用用户行为与item的向量化用户行为与物品之间的相似CTR预估离线排序模型F...

2018-10-09 06:52:11

阅读数 344

评论数 0

转载 文因互联 CEO 鲍捷:确保搞砸人工智能项目的十种方法

文因互联 CEO 鲍捷:确保搞砸人工智能项目的十种方法 原创: 鲍捷 文因互联 前天 做成一件事儿不容易,而坑恒在。 鲍捷博士于5月10日在将门创投的线上 talk 中盘点了人工智能项目的大坑小坑,选出了看上去非常反常识的十个经典坑。 这是一篇大实话合集,但别绝望,最后将会放出从二十年...

2018-08-03 16:35:50

阅读数 203

评论数 0

原创 TODO L

要写的目录 最近一段时间,由于太忙(根本就是懒)停止了博客的更新,时间也快有一年了。停博的这段时间,在我身上是发生了太多太多事。关于技术博客,我将想写的主题暂列如下,后边慢慢补充。 1 simhash 重复文章识别 2 reclib slim top 推荐实现 3 人脸识别facenet算...

2018-07-11 09:58:52

阅读数 145

评论数 0

转载 那些你无比崇拜的厉害人,是如何建构知识体系的

那些你无比崇拜的厉害人,是如何建构知识体系的? 2018-04-04 六合同风 文 | Lachel 高效思维达人,知识管理专家,深度思考践行者,领英、36氪特约作家 来源 | L先生说(ID:lxianshengmiao) 这是我总结的“知识体系矩阵”。它有 9 个元素,分别代表了...

2018-04-04 15:07:28

阅读数 683

评论数 0

原创 (论文阅读笔记1)Collaborative Metric Learning(二)(WWW2017)

三、协同度量学习    这一部分,我们讨论CML作为一种更自然的方法获得关联关系。CML的思路是这样的:我们在已知正例关系的user-item集合S\mathcal{S}上建立一个隐性反馈模型,并且学习user-item的距离作为他们的关系。学习到的距离使得S\mathcal{S}中的对更加紧密,...

2017-08-20 17:33:02

阅读数 1134

评论数 1

原创 (论文阅读笔记1)Collaborative Metric Learning(一)(WWW2017)

一、摘要    度量学习算法产生的距离度量捕获数据之间的重要关系。这里,我们将度量学习和协同过滤联系起来,提出了协同度量学习(CML),它可以学习出一个共同的度量空间来编码用户偏好和user-user 和 item-item的相似度。二、背景2.1 Metric Learning     令χ={...

2017-07-31 22:38:50

阅读数 2010

评论数 3

原创 深入理解simhash原理

一、LSH 介绍    LSH(Locality sensitive hashing)是局部敏感性hashing,它与传统的hash是不同的。传统hash的目的是希望得到O(1)的查找性能,将原始数据映射到相应的桶内。     LSH的基本思想是将空间中原始数据相邻的2个数据点通过映射或者投影变...

2017-07-30 11:04:48

阅读数 1098

评论数 0

原创 实时重复文章识别——SimHash

一、背景介绍    在前边的文章中,我们采用的是用google的Doc2Vec模型来识别重复文章的,从线上运行的效果来看,它的准确率是比较高的。当然,这是建立在把所有的文章都当做训练数据来训练Doc2Vec模型的基础上的,它推断出一篇文章的向量之后再去做相似计算的效果是不太好的。况且,训练模型的耗...

2017-06-24 11:07:40

阅读数 1752

评论数 0

原创 Doc2Vec训练相似文章识别模型

一、需求描述     由于在平台上发布的文章是来源于不同渠道和作者的,发布的文章也存在一定程度上的抄袭或者太相似。为了避免对用户体验造成影响,避免不必要的文章费用支出,需要识别出哪些文章是相似的。数据源是若干文章(中文),初步选择方法为利用doc2vec模型,它类似于word2vec,下面就让我们...

2017-05-14 10:47:44

阅读数 3437

评论数 1

提示
确定要删除当前文章?
取消 删除