![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 77
骆驼算法学习笔记
我是 骆驼 喜欢人工智能,行动派 创造力,思考力,学习力提升修炼进行中 欢迎志同道的人一起学习~
尼采的三种境界“骆驼,狮子,孩子”在数据分析里我还只是一只骆驼,希望能吸取到更多的知识。
展开
-
大白话讲解数据挖掘【案例】潜客模型的数据框架
前言:本篇文章作为回答很多朋友问我的一个问题:到底数据挖掘是什么?有什么作用?我把数据挖掘比喻成炒菜烧饭。下面用了一个潜客模型的框架作为案例进行讲解。因为我在互联网公司,所以流量是整个流程图的开始。第一步:数据准备(去菜场买食材,到家清洗食材)第二步:做模型(将食材加工成各类食物,咸味、甜味、淡原创 2015-08-03 23:19:17 · 7669 阅读 · 1 评论 -
大白话讲解决策树【案例】:如何区分西方人和东方人
【前言】:决策树是一种十分常用的分类方法。它是一种监督学习,所谓监督学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。决策树有很多种算法:CHAID,CART,C4.5,C5.0。不过决策树的核心理论都其实差不多,本文将从介绍ID3的思想,方便各位读者理解决策树的核心理念。原创 2015-08-15 21:47:25 · 4952 阅读 · 3 评论 -
一元线性回归(原理)
前言:一元线性回归是数据挖掘的基础模型,其中包含了非常重要的数学回归的概念,是学习多元回归,广义线性回归的基础。本文主要讲解1)基础原理2)数学推导3)R语言演示,来介绍一元线性回归。关键词:一元线性回归基础原理、最小二乘法、数学推导、R语言整体思路:根据已知点求一条直线,希望直线与各个点距离之和为最小,根据最小二乘法算出最小时直线的参数。原创 2015-09-09 00:15:03 · 9309 阅读 · 0 评论 -
r语言ggplot2包学习笔记(上:代码+注释)
ggplot2包学习的课堂笔记~原创 2015-10-08 17:36:12 · 6732 阅读 · 0 评论 -
KnnR语言实现学习笔记
前言:来自《机器学习与R语言实践》课程# 利用R自带的iris数据集,随机抽取1/2的样本作为训练集,另外一半的样本作为测试集来验证模型的效果iris1# 利用caret包的createDataPartition函数按不同类别等比例抽取50%library(caret)prop.table(table(iris1$Species)) #查看iris1数据集中Species变量类转载 2015-10-08 23:23:02 · 2072 阅读 · 0 评论 -
斯坦福大学Andrew Ng教授主讲的《机器学习》公开课观后感
近日,在网易公开课视频网站上看完了《机器学习》课程视频,现做个学后感,也叫观后感吧。 学习时间 从2013年7月26日星期五开始,在网易公开课视频网站上,观看由斯坦福大学Andrew Ng教授主讲的计算机系课程(编号CS229)《机器学习》(网址http://v.163.com/special/opencourse/machinelearning.html)(注:最早是在新浪公开课上转载 2015-12-07 13:25:14 · 1616 阅读 · 0 评论 -
大白话讲解ROC曲线
前言:本文用大白话和最简单的案例来解释ROC曲线及部分应用,如有任何问题或错误欢迎各位留言~~一、随机选取用户营销的解释(随机线)横轴:营销用户数(假设有1000万用户数手机号)纵轴:有响应的用户数(假设如果1000万全部发短信营销,最高会有100万人响应)即总体响应的用户数占营销用户数的10%。如果我们随机抽取营销用户数做短信营销时,得到结果应该接近于总体概率。即:原创 2015-06-29 14:07:56 · 18678 阅读 · 1 评论 -
Overfitting-Regulization L1\L2正则化
正则化的作用:防止过拟合。讲述了 L1和L2的推导原创 2016-03-07 22:10:52 · 1680 阅读 · 0 评论 -
一些我推荐的和想上的网络课程(Coursera, edX, Udacity,MIT OCW)
转载自 http://blog.csdn.net/fightforyourdream/article/details/21314929感觉是很好的CS 网上公开课总结,在终身学习时代,好好利用网络学习资源对于个人成长和发展非常重要。从面向找工作的角度出发,我觉得以下课程有很大帮助:首推Robert Sedgewick,也是我觉得对我帮助最大的老师,讲课特点是能把转载 2016-03-20 11:23:04 · 4995 阅读 · 0 评论 -
Word2vec学习笔记
主要内容:1、什么是Word2vec?为什么要Word2vec?2、常规的做法有哪些及一些简单的介绍?3、NNLM的Word2vec原理及问题解决方案(原论文《Distributed Representations of Words and Phrases and their Compositionality》)4、Word2vec工具的使用原创 2017-01-07 20:55:10 · 2371 阅读 · 0 评论 -
机器学习人群扩散(LPA算法)
1、 业务场景说明:2、 从业务映射到机器学习:3、 友商应用资料:4、 LPA方法原理:[1][3]5、 特征过滤的解决方案:[4]6、 R语言试验7、 总结(仅个人观点,欢迎指出错误):附录:一、常见的半监督学习大类:[2]二、参考文献:三、代码1、 业务场景说明原创 2016-02-03 17:44:19 · 15834 阅读 · 0 评论 -
(转)SSE,MSE,RMSE,R-square指标讲解
SSE(和方差、误差平方和):The sum of squares due to errorMSE(均方差、方差):Mean squared errorRMSE(均方根、标准差):Root mean squared errorR-square(确定系数):Coefficient of determinationAdjusted R-square:Degree-of-freedom转载 2016-02-03 14:37:34 · 129177 阅读 · 17 评论 -
大白话讲解机器学习-损失函数
损失函数是机器学习里最基础也是最为关键的一个要素,通过对损失函数的定义、优化,就可以衍生到我们现在常用的LR等算法中。原创 2016-01-31 16:20:36 · 29406 阅读 · 2 评论 -
大白话讲解卡方鉴定【案例】播放的背景音乐对于卖酒有什么样的销售影响?
【大白话】卡方鉴定前言:卡方鉴定是用于类别性与类别性的相关性鉴定,相关性越高则说明该字段对目标字段的影响相关度越高。(如果目标是类别,输入是数值则用T鉴定和方差鉴定。)学习背景:独立事件概率概念正文:【案例】播放的背景音乐对于卖酒有什么样的销售影响?三种背景音乐:1)French音乐2)Italian音乐3)无音乐三种酒类:1)French酒2)Italian酒3)其他酒原创 2015-07-28 13:03:01 · 2290 阅读 · 0 评论