算法分享
介绍各类算法、数据集、算法大赛等内容。主要包括机器学习、深度学习方面内容。
人马座α星
这个作者很懒,什么都没留下…
展开
-
医学统计学第六版笔记
笔记一直在整理,先来更一版目录第一章 绪论第二章 定量数据的统计描述第三章 正态分布与医学参考值范围第四章 定性数据的统计描述第五章 统计表与统计图第六章 参数估计与假设检验第七章 t检验第八章 方差分析第九章 X2X^{2}X2检验第十章 非参数秩和检验第十一章 线性回归与相关第十二章 多元线性回归第十三章 logistic回归分析第十四章 生存分析第十五章 实验设计与临床试验设计附表3:p215,F分布界值表(方差齐性检验)p220,q界值表,用于计算q检验第二原创 2020-08-22 15:26:37 · 974 阅读 · 0 评论 -
Distribute Strategy--翻译学习
Overviewtf.distribute.Strategy,是一个用于多GPU、多服务器或多TPU进行分布式模型训练的API接口。用户通过改动较少的代码就可以使用该接口进行分布式训练。该API除了可进行分布式训练外也可实现在不同的平台进行分布式评估和预测。但本文档主要是讨论分布式的训练。官方文档中给出如下代码。# Import TensorFlow# __future__包在python...翻译 2019-06-04 10:16:49 · 2492 阅读 · 0 评论 -
基于tensorflow的DCGAN
DCGAN,Deep Convolutional Generative Adversarial Network 。什么是生成对抗网络GANs?生成对抗网络,实质上就是两个模型在一个对抗的过程中同时训练的过程。一个是生产者,也可以认为是艺术家,在欣赏完真实的图片之后,自己去创造图片。另一个是鉴别者,也可以认为是鉴赏家,鉴别出哪些是真实图片哪些是生产者学习创造的图片。在这个训练的过程中,生产者...翻译 2019-03-15 18:07:24 · 945 阅读 · 0 评论 -
LendingClub: The Power of Data & The Next Generation Credit Model
2017.09.08,推出的第五代信用模型。数据:10年的LendingClub数据它比单独计算借款人的FICO得分更具有预测性,并且比第四代模型更能区分借款人还款的可能性,准确率高出24%。该模型可以为那些在传统贷款项目中错误地将风险归为过高但实际上是良好借款人的人提供便利,也可以筛选出看似安全但我们认为存在风险的借款人。新模型优点新模型使用了更多借款人的数据新的属性的应用:...翻译 2019-01-10 16:40:49 · 158 阅读 · 0 评论 -
聚类——总结
聚类聚类,就是将样本划分为若干子集的过程,这些子集一般是不相交的。分类聚类方法可大致分为原型聚类、密度聚类、层次聚类。原型聚类:原型聚类是指聚类结构能通过一组原型刻画,原型是指样本空间中具有代表性的点。通常情况下,算法先对原型进行初始化,然后对原型进行迭代更新求解。密度聚类:从样本密度的角度来考察样本之间的可连接性,并基于可连接样本不断扩展聚类簇以获得最终结果。它可以在有噪音的数据中发...原创 2018-12-11 11:42:56 · 427 阅读 · 0 评论 -
手动离线无网安装tensorflow, tensorflow安装包总结
所需依赖包jzzd7125Werkzeug >=0.11Wheel 0.32tensorboard 1.12protobuf 3.6.1absl-py 0.2.1astor 0.6.2bleach 1.5.0gast 0.2.0grpcio 1.12.0html5lib 0.9999999...原创 2018-10-30 17:48:27 · 6012 阅读 · 3 评论 -
Common Objects in Context之object Detection——COCO:津南数字制造算法挑战赛【赛场二】数据相关
我是在天池大赛的“津南数字制造算法挑战赛【赛场二】”中第一次了解到该数据集的。什么是COCO?COCO实质上是一些用于目标检测、图像分割、目标标注的数据集。在现在计算机视觉领域被大量使用。赞助商赞助商包括微软、facebook、Mighty AI、CVDFData format相关地址github API接口COCO有五种注释类型,包括目标检测、关键点检测、物品分割、全景分割、图像...原创 2019-02-28 18:09:58 · 1257 阅读 · 3 评论 -
Kaggle比赛之Artifical Neural Networks Applied to Taxi Destination Prediction代码整理
Code of the winning entry to the Kaggle ECML/PKDD taxi destination competition. Our approach is described in our paper.依赖性我们使用了MILA实验室的这些包:Theano. 通用的gpu加速python数学库,具有类似numpy的接口 (see [3, 4])....翻译 2018-09-06 09:18:31 · 494 阅读 · 2 评论 -
Kggle比赛之Artifical Neural Networks Applied to Taxi Destination Prediction
Artifical Neural Networks Applied to Taxi Destination Prediction摘要:本文主要是基于出租车轨迹对终点的预测。其中,数据为长度不同的来自GPS的节点和各种各样相关的元信息(meta-information)。比如,出租车出发时间、司机的ID、乘客信息。本方法是一种基于神经网络的自动预测方法。我们尝试的模型架构包括多层感知机(...翻译 2018-09-06 09:05:42 · 777 阅读 · 0 评论 -
蒸馏算法闲聊
蒸馏算法的经典论文为《Distilling the Knowledge in a Neural Network》解决问题就是,在使用的时候,把复杂模型变简单,把大模型变小。所以叫蒸馏。下图是我看到最明白的整理模型图分享一下地址简述过程首先说明,此处一般指多分类网络。硬标签指0、1;软标签指概率;1、用硬标签训练大网络(硬标签)2、用训练好的大网络来得到样本的软标签3、用软标签和硬标签...原创 2019-10-03 16:13:07 · 1679 阅读 · 0 评论