自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 算法基础-->图论(BFS,DFS)

本篇博文将总结和图相关的一些算法,其中又以广度优先搜索和深度优先搜索最为重要。图的表示:邻接矩阵 n∗nn*n 的矩阵,有边是 11,无边是 00,nn 表示结点个数。邻接表 为每个点建立一个链表(数组)存放与之连接的点。搜索:BFS(Breadth−First−Search)BFS (Breadth-First-Search) 广(宽)度优先DFS(Depth−First−Sear

2017-08-31 19:50:41 1641

原创 算法基础-- >树

本篇博文将总结关于树的一些算法,树部分的内容挺多,但是不难,主要考察的是coding能力,本人就是感觉自己coding能力太差,所以关于代码实现部分都要自己实现一遍,不会的在网上查资料跟着敲一遍。树和二叉树的关系一般地说,树的结点间是无序 的,即:一个结点有m个孩子,则 L1,L2,L3,...,Lm{L}_{1},{L}_{2},{L}_{3},...,{L}_{m} 可以互换位置,仍然认为是同

2017-08-30 16:38:14 526

原创 算法基础-- >数组

本篇博文将详细总结与数组相关的一些算法。求局部最大值问题描述给定一个无重复 元素的数组 A[0…N−1]A[0…N-1],求找到一个 该数组的局部最大值。规定:在数组边界外的值无穷小。即: A[0]>A[−1],A[N−1]>A[N]A[0]>A[-1],A[N-1] >A[N]。显然,遍历一遍可以找到全局最大值,而全局最大值显然是局部最大值,但是时间复杂度达到 O(n)O(n),能不能找到一个时间

2017-08-27 12:12:59 1011

原创 算法基础-- >字符串(LCS,KMP,Huffman,Manacher)

本篇博文将详细总结算法里面关于字符串部分知识,包括:字符串循环左移LCS最长递增子序列KMPHuffman编码这里面一些算法比如LCS,KMP,Huffman是非常难以理解的,也是一些笔试面试经常遇见的问题,务必要全部弄清楚。字符串循环左移给定一个字符串S[0…N-1],要求把S的前k个字符移动到S的尾部,如把字符串“abcdef”前面的2个字符‘a’、‘b’移动到字符串的尾部,得到新字符

2017-08-22 23:50:29 1441

原创 算法基础-- > 链表,堆栈,队列

从这篇博文开始,我将总结一些常用的传统算法的思想核心。本篇博文主要总结链表,堆栈,队列。链表链表相加给定两个链表,分别表示两个非负整数。它们的数字逆序存储 在链表中,且每个结点只存储一个数字,计算两个数的和,并且返回和的链表头指针。如:输入:2→4→3、5→6→4,输出:7→0→8问题分析:因为两个数都是逆序存储,正好可以从头向后依次相加,完成“两个数的竖式计算”。#include<stdio.h>

2017-08-21 17:44:31 929

原创 机器学习 -- > 检测异常样本方法总结

数据预处理的好坏,很大程度上决定了模型分析结果的好坏。 其中,异常值(outliers)检测是整个数据预处理过程中,十分重要的一环。方法也是多种多样。由于异常值检验,和去重、缺失值处理不同,它带有一定的主观性。在实际业务场景中,我们要根据具体的业务逻辑来判别哪些样本是离群点,下面我总结几个比较常用,通用的异常值检测方法。可视化的方法画出样本集某一个特征而言,可以直接画出这个样本集在这个特征上值的分

2017-08-18 16:17:21 18551 5

转载 Kesci“魔镜杯”风控算法大赛复赛解决方案

看到一篇非常好的文章,讲的是如何将机器学习应用在金融风控上。整个解决方案的思路写的非常详细清楚,经典。实在忍不住,在未经原作者同意就转载了,实在是抱歉。原始文章网址 http://blog.csdn.net/bryan__/article/details/51190452 。好了,大家开始好好享用下面的知识吧。决赛答辩第4,获得铜奖代码地址:https://github.com/wepe/PPD

2017-08-16 23:06:03 1884

原创 机器学习-->深度学习-->RNN,LSTM

本篇博文将把我所学习的循环神经网络(RNN)和长短时记忆神经网络(LSTM)做一个详细的总结分析。RNN为什么会有循环神经网络传统的神经网络(包括CNN),输入输出都是互相独立的 。但是在一些场景中,后续的输出和之前的内容是相关的。比如一段句子的输出“我在CSDN上发表了一篇文_”,这里后续的输出和前面的文字有着很大的联系。传统的神经网络对这样的任务无法很好的进行预测。循环神经网络结构简单来看,就是

2017-08-16 00:13:00 6722 1

原创 机器学习-->矢量化运算,矩阵运算,广播

在机器学习中,我们常常需要处理各式各样的数据,其中向量形式,矩阵形式的数据是经常遇见的。同时又经常需要对两个或者多个向量形式,矩阵形式的数据做元素级的操作处理。通常最简单无脑的办法就是用循环对数据一个个的进行处理。显然这种处理方式不仅费时费力而且写出来的代码给人感觉很繁琐。既然数据呈向量或者矩阵形式,为什么我们不把这种形式很好的加以利用呢?要知道矢量化的运算要比等价的纯python快上一两个数量级甚

2017-08-12 22:30:55 5563 1

原创 机器学习-->深度学习-->pytorch学习

本篇博文将大概的总结下深度学习框架pytorch的使用。张量的说明标量(Scalar)是只有大小,没有方向的量,如1,2,3等向量(Vector)是有大小和方向的量,其实就是一串数字,如(1,2)矩阵(Matrix)是好几个向量拍成一排合并而成的一堆数字,如[1,2;3,4]标量,向量,矩阵它们三个也是张量,标量是零维的张量,向量是一维的张量,矩阵是二维的张量。除此之外,张量还可以是四维的、五维等等

2017-08-11 16:44:54 4636

原创 机器学习-- >无监督学习-- >EM算法

本篇博文将详细总结机器学习里面一个非常重要的算法-EM算法。复习Jensen不等式若f是凸函数 凸函数即割线在函数线的上方。基本Jensen不等式:若,则有上面是针对离散情况,若对于连续情况可以推得:若有 on ,,则可得: 即有 其中E f(x) 表示f(x)在p(x)这样一个分布下的期望。EM算法前面的博文中讲到了K-means聚类算法,能够非常方便的 将未标记的样本分成若干簇,但无法

2017-08-10 23:19:24 6189

原创 机器学习-->python 数据生成器总结

我们在学习机器学习算法时,经常需要对比不同的算法在不同的数据集上表现好坏,需要有按照不同的需求来自定义的生成一些数据集。本篇博文将总结python里面一些用来数据生成的包。最简单的等差数据和等比数据# 如果生成一定规则的数据,可以使用NumPy提供的专门函数 # arange函数类似于python的range函数:指定起始值、终止值和步长来创建数组 # 和Python的range类似,arang

2017-08-10 10:53:09 2364

原创 机器学习-->无监督学习-->聚类

本篇博文将详细总结机器学习里面的一个很重要的内容-聚类。聚类定义定义聚类就是对大量未知标注 的数据集,按数据 的内在相似性将数据集划分为多个类别,使 类别内的数据相似度较大而类别间的数据相 似度较小。是无监督的分类方式。聚类思想给定一个有N个对象的数据集,构造数据的k 个簇,k≤n。满足下列条件: 每一个簇至少包含一个对象 每一个对象属于且仅属于一个簇 将满足上述条件的k个簇称作一个合理划分

2017-08-05 16:49:30 11838

原创 机器学习-- >监督学习-- >SVM

本篇博文将详细总结机器学习里面一个非常重要但又非常难以理解的一个算法模型SVM。SVM我之前一直没有弄的很明白,在总结本篇博文时,一定要将其弄得清清楚楚。将沿着以下几个主题来进行总结:线性可分支持向量机 硬间隔最大化hard margin maximization 硬间隔支持向量机 线性支持向量机 软间隔最大化soft margin maximization 软间隔支持向量机 非线

2017-08-02 12:56:18 3072 2

原创 机器学习-->集成学习-->Xgboost,GBDT,Adaboost总结

之前的博文中已经深入详细的总结了集成学习中各种提升方法,包括Xgboost,GBDT,Adaboost。本篇博文将把这三种最常见的提升方法串在一起,大概的总结下三者的区别和联系。所有总结都是我个人的看法,如有不对还望指正。相同点三者的相同点,显然都是利用了提升的思想,每一棵树的生成都是建立在上一棵树的基础之上。 细节方法,都有一些预剪枝,正则项,衰减因子,降采样等等。详细的请看之前的博文。不同点A

2017-08-01 11:43:07 1964

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除