baika4211-CSDN博客

转载特征工程-机器学习

最近，在公司实习的时候参加了一个项目，主要负责特征工程部分的工作。具体内容不方便写出来，这里只是将项目中涉及到的解决办法、思路等作为笔记记录下来。一、第一阶段（项目负责人（大神）扔给了一堆数据，让简单跑个demo，看看效果，主要用的python,涉及的库有pandas、numpy、matplotlib、sklearn等等）涉及到的数据主要分为两部分：1.有标签的...

2019-04-04 16:16:00 155

转载 BP网络-机器学习

一、BP网路特点BP算法是一种最有效的多层神经网络学习方法，其主要特点是信号前向传递，而误差后向传播，通过不断调节网络权重值，使得网络的最终输出与期望输出尽可能接近，以达到训练的目的。实际就是，通过最优化各层神经元的输入权值以及偏置，使得神经网络的输出尽可能地接近期望输出，以达到训练（或者学习）的目的。BP网络和传统神经网络一样，也是包含三层：输入、输出和多个隐藏层；（由于画图太...

2018-12-28 21:40:00 225

转载深度学习-几个常用概念

一、基础概念1.偏置除了权重，另一个线性组件应用于输入，称为偏置。它被添加到输入的权重乘法的结果中。这种偏置主要是为了改变权重的范围。在添加偏置后，结果看起来像a*W1+偏置。这是输入变换的最后一个线性分量。2.神经元神经网络中的神经元接收一个输入，处理它并产生一个输出，输出被发送到其他神经元进行进一步的处理，或者直接输出。3.权重当输入进入神经元时，会乘以一个权...

2018-12-27 15:56:00 278

转载深度学习-keras/openCV环境安装配置学习笔记

Keras最简单的安装方式就是：anaconda + pycharm + TensorFlow+（GPU或者CPU）TensorFlow 有两个版本：CPU 版本和 GPU 版本。GPU 版本需要 CUDA 和 cuDNN 的支持，CPU 版本不需要。如果你要安装 GPU 版本，请先确认你的显卡支持 CUDA。采用 pip 安装方式1.确认版本：pip版本 >= 8.1。用 p...

2018-12-26 21:22:00 329

转载深度学习-Keras框架学习笔记

看了很多前辈对深度学习框架的介绍，虽然很多新人会用TensorFlow，但是Keras代码更加简单精简，更受深度学习初学者的青睐。Keras是一个高层神经网络API，Keras由纯Python编写而成并基Tensorflow、Theano以及CNTK后端。Keras在以下场景会大放异彩：简易和快速的原型设计（keras具有高度模块化，极简，和可扩充特性）支持CNN和R...

2018-12-26 15:29:00 246

转载各类二叉树及红黑树简述

红黑树（Red Black Tree）是一种自平衡二叉查找树，典型的用途是实现关联数组。红黑树和AVL（平衡二叉搜索树）树类似，都是在进行插入和删除操作时通过特定操作保持二叉查找树的平衡，从而获得较高的查找性能。它可以在O(log n)时间内做查找，插入和删除，这里的n为树中元素的数目。红黑树在很多地方都有应用。在C++ STL中，很多部分(包括set, multiset, m...

2018-12-04 21:42:00 167

转载子数组的最大和问题

输入一个整形数组，求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4, 7, 2, -5，和最大的子数组为3, 10, -4, 7, 2，因此输出为该子数组的和18。注：如果当前状态的累加和小于0，则放弃该状态，将其归零。//依次遍历数组中的每个元素，把他们相加，如果累加和小于0，则把当前元素之和清为0，否则和最大和比较，...

2018-11-30 11:08:00 113

转载给一列无序数组，求出中位数并给出算法的时间复杂度

若数组有奇数个元素，中位数是a[(n-1)/2]；若数组有偶数个元素，中位数为a[n/2-1]和a[n/2]两个数的平均值。这里为方便起见，假设数组为奇数个元素。思路一：把无序数组排好序，取出中间的元素。时间复杂度取决于排序算法，最快是快速排序，O(nlogn)，或者是非比较的基数排序，时间为O(n),空间为O(n)。这明显不是我们想要的。思路二：采用快速排序的分治partiti...

2018-11-29 21:11:00 2716

转载有10亿个杂乱无章的数，怎样最快地求出其中前1000大的数

1）方法1建一个1000个数的最小堆，然后依次添加剩余元素，如果大于堆顶的数（堆中最小的），将这个数替换堆顶，并调整结构使之仍然是一个最小堆，这样，遍历完后，堆中的1000个数就是所需的最大的1000个。算法的时间复杂度为O（nlogk）=n*log1000=10n（n为10亿，k为1000）。优化的方法：分治法。可以把所有10亿个数据分组存放，比如分别放在1000个文件中。这...

2018-11-29 17:26:00 706

转载字符串数据结构算法题-C++

1）最长不重复子串使用string和vector<string>string FindLongestNonRepeatSubstring(string str){ if (str.empty()) return ""; string tmp;//存放临时不重复的子串 vector<string> svec;//存放所有...

2018-11-27 21:00:00 179

转载数组中三个数和为零

前面看到的问题是数组A中，和为固定值sum的两个数。我们一般的做法是先给数组排序，然后数组前后各有一个下标i、j，如果A[i]+A[j]>sum,则j--，如果A[i]+A[j]<sum,则i++;否则输出A[i]、A[j]。有一个类似的扩展问题就是：找到一个是数组中和为零的三个数，一般的解决方法也是设置三个下标变量，i，j和k。每次固定i，然后寻找满足条件的j 和k ;...

2018-11-22 11:37:00 745

转载两个矩形相交问题-判断是否相交

最近，面试遇到一道算法题目如下：两个矩形，判断是否相交；如果相交面积大于零，输出相交部分的左上角以及右下角坐标点，否则，输出（-1，-1）、（-1，-1）。没有给出完善的解决方案，在面试官的细心引导下，解决了两个线段相交输出交点的问题。因此下来在网上搜了相关的问题。1）下面是转自https://blog.csdn.net/szfhy/article/details/49740...

2018-11-21 21:27:00 599

转载二叉树创建以及深度优先遍历和广度优先遍历

对于一颗二叉树，深度优先搜索(Depth First Search)是沿着树的深度遍历树的节点，尽可能深的搜索树的分支。以上面二叉树为例，深度优先搜索的顺序为：ABDECFG。怎么实现这个顺序呢？深度优先搜索二叉树是先访问根结点，然后遍历左子树接着是遍历右子树，因此我们可以利用堆栈的先进后出的特点，现将右子树压栈，再将左子树压栈，这样左子树就位于栈顶，可以保证结点的左子树先与右...

2018-11-21 20:06:00 152

baika4211的博客