![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
duanyajun987
这个作者很懒,什么都没留下…
展开
-
及其学习kNN算法matble实现
KNN 算法其实简单的说就是“物以类聚”,也就是将新的没有被分类的点分类为周围的点中大多数属于的类。它采用测量不同特征值之间的距离方法进行分类,思想很简单:如果一个样本的特征空间中最为临近(欧式距离进行判断)的K个点大都属于某一个类,那么该样本就属于这个类。这就是物以类聚的思想。当然,实际中,不同的K取值会影响到分类效果,并且在K个临近点的选择中,都不加意外的认为这K个点都是已经分类好的了转载 2017-03-13 12:01:08 · 783 阅读 · 0 评论 -
如何通俗理解泊松分布?
1 甜在心馒头店公司楼下有家馒头店:每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):均值为:按道理讲均值是不错的选择(参见如何理解最小二乘法?),但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖,的时间不够卖:你“甜在心馒头店”又不是...转载 2019-03-27 16:28:15 · 984 阅读 · 0 评论 -
第二章 机器学习基础
原文:https://github.com/scutan90/DeepLearning-500-questions/blob/master/ch02_%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F%BA%E7%A1%80/%E7%AC%AC%E4%BA%8C%E7%AB%A0_%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%9F...转载 2019-03-25 18:10:32 · 12506 阅读 · 0 评论 -
正态分布-python建模
目录0.概念1.绘制单个正太分布2.比较多个正态分布2.1偏态和峰态3.应用4. z分数5.中心极限定理6.大数定理7.二项式分布与正态分布图比较 8.你的数据是正态分布吗0.概念 正态分布的函数(又称密度函数)为 标准正态分布这两个参数分别为0与1。标准正态分布的密度函数可写作: 所有正太分布都可以转化成标准正态分布...转载 2018-08-20 15:50:55 · 4186 阅读 · 0 评论 -
TensorFlow学习笔记2
TensorBoard 可视化tensorflow不仅仅是一个计算图软件,其还包含了tensorboard可视化工具,安装tensorflow的时候会默认安装,使用方法非常简单,使用writer = tf.summary.FileWriter('./graph', sess.graph)就能够创建一个文件写入器,./graph是存储目录,sess.graph表示读入的图结构。我们可转载 2017-11-13 15:04:22 · 281 阅读 · 0 评论 -
堆排序Heap sort
经典排序算法 - 堆排序Heap sort堆排序有点小复杂,分成三块第一块,什么是堆,什么是最大堆第二块,怎么将堆调整为最大堆,这部分是重点第三块,堆排序介绍第一块,什么是堆,什么是最大堆什么是堆这里的堆(二叉堆),指得不是堆栈的那个堆,而是一种数据结构。堆可以视为一棵完全的二叉树,完全二叉树的一个“优秀”的性质是,除了最转载 2017-09-24 18:29:08 · 272 阅读 · 0 评论 -
在神经网络中使用交叉熵代价函数
交叉熵代价函数是用来衡量人工神经网络(ANN)的预测值与实际值的一种方式。与二次代价函数相比,它能更有效地促进ANN的训练。在介绍交叉熵代价函数之前,本文先简要介绍二次代价函数,以及其存在的不足。1. 二次代价函数的不足 ANN的设计目的之一是为了使机器可以像人一样学习知识。人在学习分析新事物时,当发现自己犯的错误越大时,改正的力度就越大。比如投篮转载 2017-05-26 21:17:31 · 579 阅读 · 1 评论 -
pagerank算法
PageRank算法2012-09-21 17:02 96542人阅读 评论(15) 收藏 举报1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。 是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出转载 2017-03-26 21:51:34 · 474 阅读 · 0 评论 -
LSA和SVD两种矩阵分解
谈谈SVD和LSA首先SVD和LSA是什么呢,SVD全称是singular value decomposition,就是俗称的奇异值分解,SVD的用处有很多,比如可以做PCA(主成分分析),做图形压缩,做LSA,那LSA是什么呢,LSA全称Latent semantic analysis,中文的意思是隐含语义分析,LSA算是topic model的一种,对于LSA的直观认识转载 2017-03-22 16:49:49 · 2366 阅读 · 0 评论 -
分支限界算法
分支限界算法 branch and bound▼分支定界 (branch and bound) 算法是一种在问题的解空间树上搜索问题的解的方法。但与回溯算法不同,分支定界算法采用广度优先或最小耗费优先的方法搜索解空间树,并且,在分支定界算法中,每一个活结点只有一次机会成为扩展结点。 利用分支定界算法对问题的解空间树进行搜索,它的搜索策略是:转载 2017-03-01 21:51:29 · 1448 阅读 · 0 评论 -
爬虫实战——批量爬取明星图片(http://www.win4000.com/)
爬取网站美桌(http://www.win4000.com)由于该网站并没有robots协议,因此可以任意爬取。技术路线requests+re除此之外用到了pypinyin库用于进行名字到拼音的转换代码# -*- coding: utf-8 -*-"""Created on Mon Oct 16 20:32:27 2017@author: 望"""imp...转载 2019-06-25 11:06:22 · 2924 阅读 · 0 评论