- 博客(34)
- 资源 (3)
- 收藏
- 关注
原创 机器学习----统计学习方法-3(手写稿算法总结)
一、基础理解二、决策树三、ROC\AUC四、朴素贝叶斯五、逻辑斯蒂回归和最大熵模型六、支持向量机与核函数七、序列最小最优算法(SMO)八、EM算法和高斯混合模型一、基础理解 二、决策树 三、ROC\AUC 四、朴素贝叶斯五、逻辑斯蒂回归和最大熵模型 六、支持向量机与核函数 七、序列最小最...
2018-07-31 17:31:49 360
原创 大数据----Hive集成Python分析
一、Hive的基本使用● 创建数据库CREATE DATABASE IF NOT EXISTS db_hive ;● 使用数据库USE db_hive ;● 创建表'''样本数据:00:00:00 2982199073774412 [360安全卫士] 8 3 download.it.com.cn/softweb/software/firewall/an...
2018-07-26 20:36:35 2133
原创 大数据----数据分析及Ptyhon实现
一、什么是大数据二、Apache Hadoop介绍2.1、下载2.2、思想2.3、常用LINUX系统操作三、词频统计WordCount(类似TF)四、IBM股价分析一、什么是大数据 ~~~~~
2018-07-23 20:59:58 899
原创 机器学习------逻辑回归(算法详解)
一、概念二、算法2.1、LR代价函数2.2、逻辑回归与线性回归的关系三、公式四、优缺点一、概念 ~~~~~~~~在线性回归模型中,输出一般是连续的,例
2018-07-19 13:18:10 799
原创 面试问题------降采样,PCA,LDA
降采样降采样降采样 又名 下采样或缩小图像。即是采样点数减少。对于一幅N*M的图像来说,如果降采样系数为k,则即是在原图中 每行每列每隔k个点取一个点组成一幅图像。降采样很容易实现. 他的目的有两个(1)使得图像符合显示区域的大小。 (2)生成对应图像的缩略图 上采样 又名图像插值或放大图像 主要目的是放大原图像,从而...
2018-07-17 20:12:25 4134
原创 Python文件操作大全
import osos.mkdir("images") #创建一个文件os.chdir("images") #进入文件夹os.mkdir("123")if os.path.exists('images'): os.rmdir("images") #如果存在这个文件夹,删掉这个文件else: os.mkdir("im
2018-07-17 18:03:13 1067
原创 机器学习----聚类总结
一、聚类分类二、k-means2.1、基本算法2.2、 算法流程2.3、算法分析2.4、结束条件一、聚类分类        &
2018-07-17 17:50:32 1054
原创 机器学习----集成学习
一、 集成学习概述二、集成学习分类2.1、 集成学习之boostingboosting之Adaboost2.2、集成学习之baggingbagging之随机森林2.3、bagging之Stacking三、集成学习之评定方法3.1、平均法3.2、投票法3.3、学习法四、小结五、拓展前向分步算法 &n...
2018-07-16 20:00:00 802
原创 机器学习----统计学习方法-1
一、统计学习方法概论       &a
2018-07-14 20:14:17 1552
原创 牛顿法在机器学习中的运用
                ~~~~~~~~我们需要调查我们学校的男生和女生的身高分布。 假
2018-07-12 20:22:25 798
原创 EM算法及GMM(高斯混合模型)的详解
一、预备知识1.1、协方差矩阵1.2、黑塞矩阵1.3、正定矩阵二、高斯混合模型2.1、标准差椭圆2.2、高斯混合模型(GMM)2.3、多元高斯混合2.4、应用场景2.5、kmeans应用2.6、基本Jensen不等式应用三、计算流程一、预备知识1.1、协方差矩阵在高维计算协方差的时候,分母是n-1,而不是n。协方差矩阵的...
2018-07-12 19:51:32 6981 1
原创 机器学习----支持向量机(SVM算法)详解
一、原理     &nbs
2018-07-11 20:11:39 6740 1
原创 机器学习----维数灾难
一、定义 ~~~~~~~~随着维度的增加,分类器性能逐步上升,到达某点之后,其性能便逐渐下降 &
2018-07-10 20:33:33 1481
原创 机器学习----PageRank算法
一、原理1,如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高 2,如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页PageRank值也会相应提高。 In:          &
2018-07-10 19:41:14 1645 1
原创 机器学习----EM算法
一、概念顾名思义:             ~~~~~~最大期望算法(Expectation Maximization Algorithm,又译期望最大化算法),是一种迭代算法,用于含有隐变量(
2018-07-10 18:15:25 420
原创 十大经典排序算法---Python写法
一、算法概述1.1、算法分类1.2、算法复杂度1.3、相关概念二、分类2.1、冒泡排序2.2、选择排序一、算法概述1.1、算法分类十种常见排序算法可以分为两大类:      &
2018-07-10 17:15:39 576
原创 机器学习----Apriori算法(关联规则)
上来一个公式 一、概念①支持度:P(A ∩ B),既有A又有B的概率 ②置信度: P(B|A),在A发生的事件中同时发生B的概率 p(AB)/P(A) 例如购物篮分析:牛奶 ⇒ 面包 例子:[支持度:3%,置信度:40%] 支持度3%:意味着3%顾客同时购买牛奶和面包 置信度40%:意味着购买牛奶的顾客40%也购买面包 ③如果事件A中包含k个元素,那么称这个事件A为k项集事件...
2018-07-10 16:34:00 2608 1
原创 L1和L2简单易懂的理解
一、正则化(Regularization) ~~~~~~~~机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,一般英文称作ℓ1ℓ1-norm和ℓ2ℓ2-norm,
2018-07-09 20:48:29 21170
原创 Mysql安装和调试
mysql安装过程及注意事项: 1.1. 下载:1.2. 配置环境变量:1.3、添加服务和启动服务1.4、测试连接1.6. 登录mysql:1.7. 查询用户密码:1.8. 设置(或修改)root用户密码:1.9. 退出mysql:mysql安装过程及注意事项: 1
2018-07-08 17:14:12 1275 1
原创 机器学习----朴素贝叶斯详解
一、概率基础知识         &amp
2018-07-08 10:51:19 699
原创 机器学习----算法图解
第一章、算法简介二分查找简单的说想要找到目标数据,就是在有序排列的数据中先从有相关的数据中查找。 打个比方: 假设要在电话簿中找一个名字以K打头的人,(现在谁还用电话簿!) 可以从头开始翻页,直到进入以K打头的部分。但你很可能不这样做,而 是从中间开始,因为你知道以K打头的名字在电话簿中间。优化的二分查找,先看例子 假设你要在字典中查找一个单词,而该...
2018-07-05 14:46:08 1175
原创 机器学习----距离分类
一、欧式距离二、曼哈顿距离三、切比雪夫距离四、闵可夫斯基距离(闵式距离)五、马氏距离六、标准欧式距离七、汉明距离八、杰卡顿距离集中常见的距离 一、欧式距离           &
2018-07-02 15:42:38 1063
原创 机器学习----回归模型
一、回归模型的分类 知识点 二、多元线性回归 正则化三、非线性回归可转变为线性回归 四、回归模型评估指标 五、分类回归树...
2018-07-01 18:14:42 355
原创 机器学习----朴素贝叶斯介绍
一、什么是贝叶斯             &amp
2018-07-01 16:37:35 400
原创 机器学习----SVM支持向量机
一、什么是SVM先看思维导图: ● 左边是求解基本的SVM问题 ● 右边是相关扩展 一张图解决问题 SVM支持二分类,不适用于多分类 二、原理SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题.简单地说,就是升维和线性化.升维,就是...
2018-07-01 15:04:15 482
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人