机器学习
文章平均质量分 53
深度瞎学汪
这个作者很懒,什么都没留下…
展开
-
FFM原理与 LR
FM(Factorization Machine) 因式分解机 应用范围 解决稀疏数据下的特征组合问题 问题原因 :经过One-Hot编码之后,样本的维度大幅增加,大部分样本数据特征是比较稀疏的。 通过观察大量的样本数据可以发现,某些特征经过关联之后,与label之间的相关性就会提高。那么如何进行特征组合就是问题的关键。 多项式模型是包含特征组合的最直观的模型。 对于二阶多项式模型,两个特转载 2017-11-14 22:03:31 · 1684 阅读 · 0 评论 -
阿里天池 医疗大赛 第二季 感想
医疗影像类国内的比赛当属这个了 ,参赛队伍达到了2200多支。接下来我来谈下自己在比赛中遇到的问题和一些想法。第一:在对肺实质提取的过程中 ,其实是一个比较繁琐的事。但越是精细的肺实质提取,算法达到的瓶颈就会来的越迟。传统的形态学操作不失为一种好方法第二:在对输入图片训练用的分割网络。使用了 u-net 和 voxresnet。在做segmentation的时候,注意不要res原创 2017-11-17 21:23:17 · 777 阅读 · 0 评论 -
机器学习中学习曲线的 bias vs variance 以及 数据量m
关于偏差、方差以及学习曲线为代表的诊断法: 在评估假设函数时,我们习惯将整个样本按照6:2:2的比例分割:60%训练集training set、20%交叉验证集cross validation set、20%测试集test set,分别用于拟合假设函数、模型选择和预测。 模型选择的方法为: 1. 使用训练集训练出 10 个模型 2. 用 10 个模型分别对交叉验证集计算得出交叉验证误差(代价原创 2017-11-24 21:02:12 · 1937 阅读 · 0 评论 -
win7 conda 安装 tensorflow
目前Anaconda的tensorflow安装包只有CPU版,如果想使用GPU版建议使用pip安装或Docker安装 1.更改清华镜像源库 以便安装速度提高 TUNA 提供了 Anaconda 仓库的镜像,运行以下命令:conda config –add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ cond原创 2017-11-21 15:43:06 · 535 阅读 · 1 评论 -
svm 相关的一些感想
SVM的整理思路和流程: 然后到了线性分类器——>分类标准的起源:Logistic回归 —–> 函数间隔—->几何间隔几何间隔—>求解最优化问题—-> svm的 对偶算法 若线性不可分—-> 引入核函数—>序列最小最优算法第一层、了解SVM支持向量机,因其英文名为support vector machine,故一般简称SVM,通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线原创 2017-11-28 09:40:59 · 481 阅读 · 0 评论 -
xgboost 的前世今生
可谓是 了解了 xgboost ,就了解了机器学习的一大半算法。博主此意并不是刻意夸大xgboost的算法强大,在这里 我想说的是 xgboost 的来由 是渐渐演变的,是一个绝世高手成长的过程。xgboost 渐渐成了工业界最喜爱的宠儿,学生们竞赛的利器。接下来,让博主来揭开它神秘的面纱吧!接下来给出整篇文章的结构:1: XGBoost的函数模型2:XGBoost的目标函数 1原创 2017-11-28 10:41:35 · 4542 阅读 · 0 评论