机器学习
文章平均质量分 75
the_Chain_Warden
这个作者很懒,什么都没留下…
展开
-
FM学习笔记
隐因子分解机Factorization Machine Factorization Machines 学习笔记(四)学习算法 深入浅出ML之Factorization家族 深入FMM原理与实践 未完待续。。。。转载 2016-09-07 17:05:37 · 788 阅读 · 0 评论 -
K-Means Python实现
转载自http://nathanlvzs.github.io/blog/Clustering-KMeans.html实现代码基本参考K-Means聚类及其Python实现,中间加了一些对距离矩阵的理解,# -*- coding: utf-8 -*-"""Created on Mon Sep 19 22:23:34 2016@author: soso"""import nump转载 2016-09-20 01:52:19 · 1995 阅读 · 0 评论 -
特征工程
特征工程定义数据预处理特征选择降维 特征工程 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。特征工程的目的是最大限度地从原始数据中提取特征以供算法和模型使用。 数据预处理 初步提取的特征可能具有如下问题:1.不属于同一量纲:即特征的规格不一样,不能够放在一起比较。无量纲化可以解决这一问题。2.信息冗余:对于某些定量特征,其包含的有效信息为区间划原创 2016-09-07 16:52:29 · 1386 阅读 · 0 评论 -
评价标准NDCG
评价标准性能良好的评分模型,应该能够给予那些引起msg或click的候选会员更高的评分(排序靠前),从而推荐给指定会员。本次竞赛的主要排名标准为Normalized Discounted Cumulative Gain(NDCG),定义如下:这里。其中n为候选会员集合中的总人数,表示模型给出的排序中,排名为的候选会员的实际ACTION值(msg=2,click=1,re原创 2016-10-11 10:33:29 · 1084 阅读 · 0 评论 -
特征选择
转载:http://blog.csdn.net/shanglianlm/article/details/494644451. 前言1-1 问题:从 D 维特征中选择 dD 个特征。1-2 特征选择主要回答两个层面的问题:对特征的评价,即怎样衡量一组特征对分类的有效性;寻优的算法,即怎样更快地找到性能最优或比较好的特征组合。2. 特征的评价准则转载 2016-10-06 16:57:56 · 2632 阅读 · 0 评论