机器学习
文章平均质量分 77
骆驼算法学习笔记
我是 骆驼 喜欢人工智能,行动派 创造力,思考力,学习力提升修炼进行中 欢迎志同道的人一起学习~
尼采的三种境界“骆驼,狮子,孩子”在数据分析里我还只是一只骆驼,希望能吸取到更多的知识。
展开
-
大白话讲解机器学习-损失函数
损失函数是机器学习里最基础也是最为关键的一个要素,通过对损失函数的定义、优化,就可以衍生到我们现在常用的LR等算法中。原创 2016-01-31 16:20:36 · 29493 阅读 · 2 评论 -
斯坦福大学Andrew Ng教授主讲的《机器学习》公开课观后感
近日,在网易公开课视频网站上看完了《机器学习》课程视频,现做个学后感,也叫观后感吧。 学习时间 从2013年7月26日星期五开始,在网易公开课视频网站上,观看由斯坦福大学Andrew Ng教授主讲的计算机系课程(编号CS229)《机器学习》(网址http://v.163.com/special/opencourse/machinelearning.html)(注:最早是在新浪公开课上转载 2015-12-07 13:25:14 · 1621 阅读 · 0 评论 -
KnnR语言实现学习笔记
前言:来自《机器学习与R语言实践》课程# 利用R自带的iris数据集,随机抽取1/2的样本作为训练集,另外一半的样本作为测试集来验证模型的效果iris1# 利用caret包的createDataPartition函数按不同类别等比例抽取50%library(caret)prop.table(table(iris1$Species)) #查看iris1数据集中Species变量类转载 2015-10-08 23:23:02 · 2082 阅读 · 0 评论 -
r语言ggplot2包学习笔记(上:代码+注释)
ggplot2包学习的课堂笔记~原创 2015-10-08 17:36:12 · 6754 阅读 · 0 评论 -
一元线性回归(原理)
前言:一元线性回归是数据挖掘的基础模型,其中包含了非常重要的数学回归的概念,是学习多元回归,广义线性回归的基础。本文主要讲解1)基础原理2)数学推导3)R语言演示,来介绍一元线性回归。关键词:一元线性回归基础原理、最小二乘法、数学推导、R语言整体思路:根据已知点求一条直线,希望直线与各个点距离之和为最小,根据最小二乘法算出最小时直线的参数。原创 2015-09-09 00:15:03 · 9342 阅读 · 0 评论 -
大白话讲解决策树【案例】:如何区分西方人和东方人
【前言】:决策树是一种十分常用的分类方法。它是一种监督学习,所谓监督学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。决策树有很多种算法:CHAID,CART,C4.5,C5.0。不过决策树的核心理论都其实差不多,本文将从介绍ID3的思想,方便各位读者理解决策树的核心理念。原创 2015-08-15 21:47:25 · 4957 阅读 · 3 评论 -
大白话讲解卡方鉴定【案例】播放的背景音乐对于卖酒有什么样的销售影响?
【大白话】卡方鉴定前言:卡方鉴定是用于类别性与类别性的相关性鉴定,相关性越高则说明该字段对目标字段的影响相关度越高。(如果目标是类别,输入是数值则用T鉴定和方差鉴定。)学习背景:独立事件概率概念正文:【案例】播放的背景音乐对于卖酒有什么样的销售影响?三种背景音乐:1)French音乐2)Italian音乐3)无音乐三种酒类:1)French酒2)Italian酒3)其他酒原创 2015-07-28 13:03:01 · 2300 阅读 · 0 评论 -
BP神经网络(python代码)
神经网络是深度学习的基础。个人理解神经网络就是可以拟合任何一种广义线性模型的结构,本文主要记录python代码的学习笔记。原创 2016-02-23 17:34:02 · 16552 阅读 · 7 评论 -
文本情感分析(一)
最近和小伙伴一起研究文本的情感分类,所以做一个记录。一、背景: 商品的评论信息,好评与差评约各20000条。二、目标: 根据现有的样本做一个分类器。三、方案: 方案一:情感类词库,进行线性求和。 方案二:句向量+传统机器学习分类器。 方案三:句向量+DNN分类器 方案四:词向量原创 2017-03-20 00:27:39 · 3991 阅读 · 1 评论 -
小D文稿
原创 2018-03-23 18:06:50 · 740 阅读 · 0 评论 -
Isolation Forest算法原理详解
转载:该博客我觉得是写Isolation Forest逻辑最为简介与清晰的,转载做收藏。本文只介绍原论文中的 Isolation Forest 孤立点检测算法的原理,实际的代码实现详解请参照我的另一篇博客:Isolation Forest算法实现详解。 或者读者可以到我的GitHub上去下载完整的项目源码以及测试代码(源代码程序是基于maven构建): https://github.c...转载 2018-06-18 14:39:47 · 3820 阅读 · 0 评论 -
奇异值分解(SVD) --- 几何意义
PS:一直以来对SVD分解似懂非懂,此文为译文,原文以细致的分析+大量的可视化图形演示了SVD的几何意义。能在有限的篇幅把 这个问题讲解的如此清晰,实属不易。原文举了一个简单的图像处理问题,简单形象,真心希望路过的各路朋友能从不同的角度阐述下自己对SVD实际意义的理 解,比如 个性化推荐中应用了SVD,文本以及Web挖掘的时候也经常会用到SVD。原文:We recommend a si转载 2016-02-06 11:44:29 · 783 阅读 · 0 评论 -
大白话讲解ROC曲线
前言:本文用大白话和最简单的案例来解释ROC曲线及部分应用,如有任何问题或错误欢迎各位留言~~一、随机选取用户营销的解释(随机线)横轴:营销用户数(假设有1000万用户数手机号)纵轴:有响应的用户数(假设如果1000万全部发短信营销,最高会有100万人响应)即总体响应的用户数占营销用户数的10%。如果我们随机抽取营销用户数做短信营销时,得到结果应该接近于总体概率。即:原创 2015-06-29 14:07:56 · 18731 阅读 · 1 评论 -
Overfitting-Regulization L1\L2正则化
正则化的作用:防止过拟合。讲述了 L1和L2的推导原创 2016-03-07 22:10:52 · 1686 阅读 · 0 评论 -
(转)SSE,MSE,RMSE,R-square指标讲解
SSE(和方差、误差平方和):The sum of squares due to errorMSE(均方差、方差):Mean squared errorRMSE(均方根、标准差):Root mean squared errorR-square(确定系数):Coefficient of determinationAdjusted R-square:Degree-of-freedom转载 2016-02-03 14:37:34 · 129333 阅读 · 17 评论 -
机器学习框架
图:机器学习框架1、 特征库:特征库就是我们获取用户信息的源头,所有的挖掘判断全部都需要从这个特征库开始,所以特征库的好坏很大程度上决定了整个数据挖掘的好坏。(名言:垃圾进垃圾处出。再好的算法,如果没有准确的信息量做支撑,也不可能预测出好的结果。)特征库不等于用户画像,特征库是用户画像的底层建设。通常维度与指标是越细越好,比如用户最近一次访问时长,用户最近两次访问时长,用户1,3原创 2016-02-03 16:04:22 · 1797 阅读 · 0 评论 -
向量化思想学习笔记
向量化思想学习笔记原创 2016-03-06 11:04:53 · 4393 阅读 · 0 评论 -
梯度下降实现案例(含python代码)
梯度下降实现案例(含python代码)原创 2016-02-16 23:42:07 · 31387 阅读 · 2 评论 -
机器学习人群扩散(LPA算法)
1、 业务场景说明:2、 从业务映射到机器学习:3、 友商应用资料:4、 LPA方法原理:[1][3]5、 特征过滤的解决方案:[4]6、 R语言试验7、 总结(仅个人观点,欢迎指出错误):附录:一、常见的半监督学习大类:[2]二、参考文献:三、代码1、 业务场景说明原创 2016-02-03 17:44:19 · 15861 阅读 · 0 评论 -
kaggle的手写识别比赛(python sklearn-KNN)
如果你想知道怎么玩一下kaggle?那这篇文章就非常适合你了。Kaggle练手项目:https://www.kaggle.com/c/digit-recognizer 0~9的手写体识别。项目简要:训练集:第一列为标签列,其余784列为对应像素点的明亮程度(28*28的图像)测试集:给你N*784列的像素点,让你判断这N样本的手写输入。解题思路:使用KNN算法,测算临近5个训练集是什么数字,选择投票最高的。原创 2016-02-28 23:46:33 · 3141 阅读 · 1 评论 -
银行风控案例-python学习笔记
前言:风险控制是挖掘中最为常见的应用,属于监督学习的“分类器”使用案例。我们通过以往历史数据判断用户违约的概率。本文使用了Logistic Regression 方法完成案例。注:根据CDA课程自己总结的学习笔记。使用的是ipython,数据及代码都已上传至个人网盘http://pan.baidu.com/s/1ntR2tmD。如果有任何问题或错误欢迎各位指正 liedward@qq.com谢谢。原创 2016-02-14 14:56:45 · 16648 阅读 · 24 评论 -
[转]Auction算法介绍
注:阅读资料,无链接,感觉写得挺好的。一、传统拍卖竞价策略1、英式拍卖(English Auction)英式拍卖又叫公开增价拍卖OAB(Open Ascending Bid),卖家提供物品,在物品拍卖过程中,买家按照竞价阶梯由低至高喊价,出价最高者成为竞买的赢家。为了保证竞价收敛,一般会为竞价设定一个终止时间。2、荷兰式拍卖(Sealed-bid Auction转载 2016-11-23 11:38:47 · 16030 阅读 · 0 评论 -
Word2vec学习笔记
主要内容:1、什么是Word2vec?为什么要Word2vec?2、常规的做法有哪些及一些简单的介绍?3、NNLM的Word2vec原理及问题解决方案(原论文《Distributed Representations of Words and Phrases and their Compositionality》)4、Word2vec工具的使用原创 2017-01-07 20:55:10 · 2401 阅读 · 0 评论 -
一些我推荐的和想上的网络课程(Coursera, edX, Udacity,MIT OCW)
转载自 http://blog.csdn.net/fightforyourdream/article/details/21314929感觉是很好的CS 网上公开课总结,在终身学习时代,好好利用网络学习资源对于个人成长和发展非常重要。从面向找工作的角度出发,我觉得以下课程有很大帮助:首推Robert Sedgewick,也是我觉得对我帮助最大的老师,讲课特点是能把转载 2016-03-20 11:23:04 · 5026 阅读 · 0 评论 -
强化学习在广告参数上的应用(未完待续)
前言:本文是根据个人自己看的blog及日常工作对其进行的一些总结。因为才疏学浅,如有不对之处,请发邮件指点liedward@qq.com。非常感谢帮忙指正错误。目录一、业务说明:二、数据模型抽象:三、强化学习算法说明四、例子:一、业务说明:搜索、推荐广告通常是一个多目标的需求。比如电商GMV公式通常如下:Ctr:一个item对应该用户的点击率预测Cvr:一个...原创 2019-06-05 15:33:00 · 755 阅读 · 0 评论