- 博客(13)
- 收藏
- 关注
转载 特征工程-机器学习
最近,在公司实习的时候参加了一个项目,主要负责特征工程部分的工作。具体内容不方便写出来,这里只是将项目中涉及到的解决办法、思路等作为笔记记录下来。一、第一阶段(项目负责人(大神)扔给了一堆数据,让简单跑个demo,看看效果,主要用的python,涉及的库有pandas、numpy、matplotlib、sklearn等等) 涉及到的数据主要分为两部分:1.有标签的...
2019-04-04 16:16:00 155
转载 BP网络-机器学习
一、BP网路特点BP算法是一种最有效的多层神经网络学习方法,其主要特点是信号前向传递,而误差后向传播,通过不断调节网络权重值,使得网络的最终输出与期望输出尽可能接近,以达到训练的目的。实际就是,通过最优化各层神经元的输入权值以及偏置,使得神经网络的输出尽可能地接近期望输出,以达到训练(或者学习)的目的。BP网络和传统神经网络一样,也是包含三层:输入、输出和多个隐藏层;(由于画图太...
2018-12-28 21:40:00 225
转载 深度学习-几个常用概念
一、基础概念1.偏置除了权重,另一个线性组件应用于输入,称为偏置。它被添加到输入的权重乘法的结果中。这种偏置主要是为了改变权重的范围。在添加偏置后,结果看起来像a*W1+偏置。这是输入变换的最后一个线性分量。2.神经元神经网络中的神经元接收一个输入,处理它并产生一个输出,输出被发送到其他神经元进行进一步的处理,或者直接输出。3.权重当输入进入神经元时,会乘以一个权...
2018-12-27 15:56:00 278
转载 深度学习-keras/openCV环境安装配置学习笔记
Keras最简单的安装方式就是:anaconda + pycharm + TensorFlow+(GPU或者CPU)TensorFlow 有两个版本:CPU 版本和 GPU 版本。GPU 版本需要 CUDA 和 cuDNN 的支持,CPU 版本不需要。如果你要安装 GPU 版本,请先确认你的显卡支持 CUDA。采用 pip 安装方式1.确认版本:pip版本 >= 8.1。用 p...
2018-12-26 21:22:00 329
转载 深度学习-Keras框架学习笔记
看了很多前辈对深度学习框架的介绍,虽然很多新人会用TensorFlow,但是Keras代码更加简单精简,更受深度学习初学者的青睐。Keras是一个高层神经网络API,Keras由纯Python编写而成并基Tensorflow、Theano以及CNTK后端。Keras在以下场景会大放异彩:简易和快速的原型设计(keras具有高度模块化,极简,和可扩充特性)支持CNN和R...
2018-12-26 15:29:00 246
转载 各类二叉树及红黑树简述
红黑树(Red Black Tree) 是一种自平衡二叉查找树,典型的用途是实现关联数组。红黑树和AVL(平衡二叉搜索树)树类似,都是在进行插入和删除操作时通过特定操作保持二叉查找树的平衡,从而获得较高的查找性能。它可以在O(log n)时间内做查找,插入和删除,这里的n为树中元素的数目。红黑树在很多地方都有应用。在C++ STL中,很多部分(包括set, multiset, m...
2018-12-04 21:42:00 167
转载 子数组的最大和问题
输入一个整形数组,求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4, 7, 2, -5,和最大的子数组为3, 10, -4, 7, 2,因此输出为该子数组的和18。注:如果当前状态的累加和小于0,则放弃该状态,将其归零。//依次遍历数组中的每个元素,把他们相加,如果累加和小于0,则把当前元素之和清为0,否则和最大和比较,...
2018-11-30 11:08:00 113
转载 给一列无序数组,求出中位数并给出算法的时间复杂度
若数组有奇数个元素,中位数是a[(n-1)/2];若数组有偶数个元素,中位数为a[n/2-1]和a[n/2]两个数的平均值。这里为方便起见,假设数组为奇数个元素。思路一:把无序数组排好序,取出中间的元素。时间复杂度取决于排序算法,最快是快速排序,O(nlogn),或者是非比较的基数排序,时间为O(n),空间为O(n)。这明显不是我们想要的。思路二:采用快速排序的分治partiti...
2018-11-29 21:11:00 2716
转载 有10亿个杂乱无章的数,怎样最快地求出其中前1000大的数
1)方法1建一个1000个数的最小堆,然后依次添加剩余元素,如果大于堆顶的数(堆中最小的),将这个数替换堆顶,并调整结构使之仍然是一个最小堆,这样,遍历完后,堆中的1000个数就是所需的最大的1000个。算法的时间复杂度为O(nlogk)=n*log1000=10n(n为10亿,k为1000)。优化的方法:分治法。可以把所有10亿个数据分组存放,比如分别放在1000个文件中。这...
2018-11-29 17:26:00 706
转载 字符串数据结构算法题-C++
1)最长不重复子串使用string和vector<string>string FindLongestNonRepeatSubstring(string str){ if (str.empty()) return ""; string tmp;//存放临时不重复的子串 vector<string> svec;//存放所有...
2018-11-27 21:00:00 179
转载 数组中三个数和为零
前面看到的问题是数组A中,和为固定值sum的两个数。我们一般的做法是先给数组排序,然后数组前后各有一个下标i、j,如果A[i]+A[j]>sum,则j--,如果A[i]+A[j]<sum,则i++;否则输出A[i]、A[j]。有一个类似的扩展问题就是:找到一个是数组中和为零的三个数,一般的解决方法也是设置三个下标变量,i,j和k。每次固定i,然后寻找满足条件的j 和k ;...
2018-11-22 11:37:00 745
转载 两个矩形相交问题-判断是否相交
最近,面试遇到一道算法题目如下:两个矩形,判断是否相交;如果相交面积大于零,输出相交部分的左上角以及右下角坐标点,否则,输出(-1,-1)、(-1,-1)。没有给出完善的解决方案,在面试官的细心引导下,解决了两个线段相交输出交点的问题。因此下来在网上搜了相关的问题。1)下面是转自https://blog.csdn.net/szfhy/article/details/49740...
2018-11-21 21:27:00 599
转载 二叉树创建 以及深度优先遍历和广度优先遍历
对于一颗二叉树,深度优先搜索(Depth First Search)是沿着树的深度遍历树的节点,尽可能深的搜索树的分支。以上面二叉树为例,深度优先搜索的顺序为:ABDECFG。怎么实现这个顺序呢 ?深度优先搜索二叉树是先访问根结点,然后遍历左子树接着是遍历右子树,因此我们可以利用堆栈的先进后出的特点,现将右子树压栈,再将左子树压栈,这样左子树就位于栈顶,可以保证结点的左子树先与右...
2018-11-21 20:06:00 152
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人