数据挖据
文章平均质量分 91
ljtyxl
大数据,智能算法研究,包括机器学习,深度学习,强化学习nlp等在推荐领域的应用和智能算法研究,比赛之类的合作联系qq:1329331182,wx:ljt1761
展开
-
Python金融大数据风控建模实战
Python金融大数据风控建模实战Python金融大数据风控建模实战https://blog.csdn.net/qq_40844276原创《Python金融大数据风控建模实战》 第18章 模型融合《Python金融大数据风控建模实战》 第18章 模型融合本章引言Python代码实现及注释本章引言模型融合思想认为,在多个表现较好的模型中,每个模型的预测结果都有一定的参考价值,并且每个模型在建模时考虑的策略也各有差异,如果能综合多个模型的优点,则最终的结果可能会更好。常用的方式为等权..转载 2021-05-26 10:23:08 · 3146 阅读 · 0 评论 -
在工作中常用到的SQL
一、回顾group 查询group查询就是分组查询,为什么要分组查询?因为我们想按某个维度进行统计。下面来看个图:现在我的数据如下比如说,我想知道:每天Java3y这个公众号的点击量是多少。按我们人工而言,思路很简单:把相同的天数以及公众号名称为Java3y的数据找出来,再将每个点击量相加,就得出了结果了。步骤用上SQL我们可能会这样写:selectname,t...转载 2019-08-09 10:23:46 · 87 阅读 · 0 评论 -
《统计学习方法》(李航)读书笔记
阅读目录知识点 感知机 k近邻法 朴素贝叶斯 决策树 logistic回归和最大熵模型 支持向量机 提升方法 EM算法 隐马尔可夫模型(HMM) 统计学习方法总结 神经网络 K-Means Bagging Apriori 降维方法 引用因为要准备面试,本文以李航的《统计学习方法》为主,结合西瓜书等其他资料对机器学习知识做一个整理.回到顶部知识点进程...转载 2019-05-29 21:12:35 · 609 阅读 · 0 评论 -
10 种最流行的 Web 挖掘工具
互联网有数不清的网页,且不断在以指数级速度产生新内容。到 2022 年,整个互联网创建和复制的数据将达到 44 ZB,也就是 44 万亿 GB。这么大体量内容的背后也带来了丰富信息源,唯一的问题是怎么在这浩如烟海的信息中检索到你想要的信息并带来价值。直接解决方案就是使用 Web 挖掘工具 。Web 挖掘是应用数据挖掘技术,从 Web 数据中提取知识。这个 web 数据可以是 Web 文档,文档...转载 2019-05-18 19:36:43 · 236 阅读 · 0 评论 -
主题模型LDA理解与应用
本文主要用于理解主题模型LDA(Latent Dirichlet Allocation)其背后的数学原理及其推导过程。本菇力求用简单的推理来论证LDA背后复杂的数学知识,苦于自身数学基础不够,因此文中还是大量引用了各方大神的数学推导细节,既是为了方便自己以后回顾,也方便读者追本溯源,当然喜欢直接看应用的读者可直接翻到第二章~基本目录如下: LDA的原理 1.1 先导数学知识准备 1....转载 2019-05-07 23:09:06 · 1116 阅读 · 1 评论 -
一种增加先验知识库的贝叶斯网络推理模型
瞿锡垚1 ,刘学军 1 ,张礼 2(1.南京航空航天大学,计算机科学与技术学院,江苏 南京 211106;2.南京林业大学,信息科学技术学院,江苏 南京 210037)摘 要 :贝叶斯网络作为一种不确定知识表示网络,由网络结构和各节点的条件概率表组成,在解决系统决策问题方面具有先天的理论优势。目前在大多数贝叶斯网络的应用中,各节点条件概率表的产生均是以人工输入的方式完成,这在一些拥...转载 2019-05-06 11:07:29 · 2110 阅读 · 0 评论 -
构建贝叶斯深度学习分类器
原文介绍在这篇博客,我会教你如何培养使用贝叶斯深学习分类Keras和tensorflow。在深入了解具体的培训示例之前,我将介绍几个重要的高级概念:什么是贝叶斯深度学习? 什么是不确定性? 为什么不确定性很重要然后,我将介绍两种在深度学习模型中包含不确定性的技术,并将使用Keras在cifar10数据集上通过冻结的ResNet50编码器训练完全连接的层。通过这个例子,我还将讨论探...翻译 2019-05-04 17:05:17 · 2525 阅读 · 1 评论 -
概率图模型-贝叶斯网络
概率图模型使用图的方法来表示概率分布,在该模型中,结点表示变量,节点之间的边表示变量之间的概略关系。概率图的分类概率图依据边的属性不同主要分为两大类:第一类是有向图无环图,表示依赖关系,称为有向图模型或贝叶斯网。第二类是使用无向图,表示变量之间的关系,称为无向图模型或马尔科夫网。当变量间存在显著地因果关系时,常使用贝叶斯网;当难以获得显式的因果关系,则常使用马尔科夫网。根据图模型...原创 2019-05-04 16:58:41 · 5273 阅读 · 1 评论 -
数据挖据基础
RSS订阅原数据挖掘学习笔记之人工神经网络(二)多层网络和反向传播算法 我们知道单个感知器仅能表示线性决策面。然而我们可以将许多的类似感知器的模型按照层次结构连接起来,这样就能表现出非线性决策的边界了,这也叫做多层感知器,重要的是怎么样学习多层感知器,这个问题有两个方面: 1、 要学习网络结构; 2、 要学习连接权值 对于一...2014-03-27 21:04:51阅...原创 2019-05-01 21:33:53 · 268 阅读 · 0 评论