自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (9)
  • 收藏
  • 关注

转载 TensorFlow Wide And Deep 模型详解与应用

Wide and deep 模型是 TensorFlow 在 2016 年 6 月左右发布的一类用于分类和回归的模型,并应用到了 Google Play 的应用推荐中 [1]。wide and deep 模型的核心思想是结合线性模型的记忆能力(memorization)和 DNN 模型的泛化能力(generalization),在训练过程中同时优化 2 个模型的参数,从而达到整体模型的预测能力最优...

2018-03-30 14:27:13 631

转载 美团“猜你喜欢”深度学习排序模型实践

一. 引言推荐作为解决信息过载和挖掘用户潜在需求的技术手段,在美团点评这样业务丰富的生活服务电子商务平台,发挥着重要的作用。在美团App里,首页的“猜你喜欢”、运营区、酒店旅游推荐等重要的业务场景,都是推荐的用武之地。 图1 美团首页“猜你喜欢”场景 目前,深度学习模型凭借其强大的表达能力和灵活的网络结构在诸多领域取得了重大突破,美团平台拥有海量的用户与商家数据,以及丰富的产品使用场景,也为深度学...

2018-03-30 11:14:39 967

转载 ###简练目的分析####NLP WordEmbedding的概念和实现

背景 如何表示词语所包含的语义?苹果?水果?Iphone? 苹果、梨子,这两个词相关吗?语言的表示 符号主义:Bags-of-word,维度高、过于稀疏、缺乏语义、模型简单 分布式表示:Word Embedding,维度低、更为稠密、包含语义、训练复杂Word Embedding 核心思想:语义相关的词语,具有相似的上下文环境,例如, 苹果和梨子 所做的事情:将每个词语训练成,词向量实践 基于ge...

2018-03-26 11:47:58 283

转载 撕起来了!谁说数据少就不能用深度学习?这锅俺不背!

作者| Andrew L. Beam编译| AI100撕逼大战,从某种角度,标志着一个产业的火热。最近,大火的深度学习,也开始撕起来了。前几日,有一篇帖子在“Simply Stats”很火,作者Jeff Leek在博文中犀利地将深度学习拉下神坛,他谈到了深度学习现在如何狂热,人们正试图用这个技术解决每一个问题。但是呢,只有极少数情况下,你才能拿到足够的数据,这样看来,深度学习也就没那么大用处了。帖...

2018-03-22 09:14:23 527

转载 BigchainDB白皮书,中文翻译

BigChainDB:可扩展区块链数据库这篇白皮书介绍BigChainDB。BigChainDB填补了去中心生态系统中的一个空白:是一个可用的去中心数据库。它具有每秒百万次写操作,存储PB级别的数据和亚秒级响应时间的性能。BigChainDB的设计起始于分布式数据库,通过创新加入了很多区块链的特性,像去中心控制、不可改变性、数字资产的创建和移动。BigChainDB继承了现代分布式数据库的特性:吞...

2018-03-21 10:05:26 5307

转载 为什么要做用户行为分析?

一、什么是用户行为?用户行为由最简单的五个元素构成:时间、地点、人物、交互、交互的内容。(一)什么是用户行为?对用户行为进行分析,要将其定义为各种事件。比如用户搜索是一个事件,在什么时间、什么平台上、哪一个ID、做了搜索、搜索的内容是什么。这是一个完整的事件,也是对用户行为的一个定义;我们可以在网站或者是 APP 中定义千千万万个这样的事件。有了这样的事件以后,就可以把用户行为连起来观察。用户首次...

2018-03-19 16:33:09 5201

转载 不均衡数据怎么破?对付它的七种武器!

先问大家一个问题:银行欺诈识别、市场实时交易、网络入侵检测等领域的数据集,有哪些共通点?答案是:“关键”事件在数据中的占比经常少于1%(例如:信用卡行骗者、点击广告的用户或被攻破的服务器的网络扫描)。然而,大多数机器学习算法在不均衡数据集的表现都不太好。以下七种技术可以帮到你,训练一个分类器用于检测不正常类别数据。 1. 使用正确指标评估权值对于不均衡数据生成的模型,使用不恰当的评估方法很危险。架...

2018-03-12 09:58:41 558

转载 笔记︱风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift)

本笔记源于CDA-DSC课程,由常国珍老师主讲。该训练营第一期为风控主题,培训内容十分紧凑,非常好,推荐:CDA数据科学家训练营——————————————————————————————————————————一、风控建模流程以及分类模型建设1、建模流程该图源自课程讲义。主要将建模过程分为了五类。数据准备、变量粗筛、变量清洗、变量细筛、建模与实施。2、分类模型种类与区别风控与其他领域一样,分类模...

2018-03-08 20:20:08 961

转载 ks值和auc值的关系

        要弄明白ks值和auc值的关系首先要弄懂roc曲线和ks曲线是怎么画出来的。其实从某个角度上来讲ROC曲线和KS曲线是一回事,只是横纵坐标的取法不同而已。拿逻辑回归举例,模型训练完成之后每个样本都会得到一个类概率值(注意是类似的类),把样本按这个类概率值排序后分成10等份,每一份单独计算它的真正率和假正率,然后计算累计概率值,用真正率和假正率的累计做为坐标画出来的就是ROC曲线,用...

2018-03-01 15:14:43 20565 3

知网Hownet情感词典.zip

该资料包含知网情感相关的词典,分为中英文单词表,每种都梳理完毕,并整理成单独文件,非常方便,有需要的话,请下载使用。

2020-05-09

mnist.pkl.gz数据文件

mnist.pkl.gz数据文件直接下载拷贝到keras的dataset下方便许多

2017-01-10

近红外猕猴桃测试分类数据

仅供分类算法测试用数据.数据内容为相隔两天的软的猕猴桃的近红外测试数据,标签为-1 和1,可以作为一个不同时间的猕猴桃的分类数据

2016-10-24

ROC曲线 源代码包

非常齐全的各类函数包,想画什么样的ROC曲线,都有相应代码,可以自己学习,也可以二次开发进行定制。

2015-10-13

基于tiny210的SD卡MP3播放器系统代码

一个小小的例程,如题所述,可以完美运行,需要的同学下下来学习下~

2015-07-17

机器学习实战源代码

这是机器学习实战,树上的全部例子代码,需要的同学可以下下来看看,帮助学习。

2015-07-17

基于FPGA的视频图像采集系统的设计与实现

基于FPGA的视频图像采集系统的设计与实现,提出了可行的基于FPGA的采集系统的设计和实现方法。

2013-05-06

多人物识别

为多人物检测提出了一种研究方法,提出了算法设计等

2013-05-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除