2018年06月_akenseren

10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 LeetCode#17. 电话号码的字母组合

给定一个仅包含数字 2-9 的字符串，返回所有它能表示的字母组合。给出数字到字母的映射如下（与电话按键相同）。注意 1 不对应任何字母。示例:输入："23"输出：["ad", "ae", "af", "bd", "be", "bf", "cd", "ce", "cf"].说明:尽管上面的答案是按字典序排列的

2018-06-30 23:07:08 187

转载基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

原文链接：点击打开链接object detection我的理解，就是在给定的图片中精确找到物体所在位置，并标注出物体的类别。object detection要解决的问题就是物体在哪里，是什么这整个流程的问题。然而，这个问题可不是那么容易解决的，物体的尺寸变化范围很大，摆放物体的角度，姿态不定，而且可以出现在图片的任何地方，更何况物体还可以是多个类别。object detection技术的演进：RC...

2018-06-28 09:47:29 319

转载基于深度学习的目标检测

1.1 选择性搜索(Selective search)目标检测的第一步是要做区域提名（Region Proposal），也就是找出可能的感兴趣区域（Region Of Interest, ROI）。区域提名类似于光学字符识别（OCR）领域的切分，OCR切分常用过切分方法，简单说就是尽量切碎到小的连通域（比如小的笔画之类），然后再根据相邻块的一些形态学特征进行合并。但目标检测的对象相比OCR领域千差...

2018-06-27 21:54:38 460

转载线性判别分析（LDA）和主成分分析(PCA)

原文链接：点击打开链接如果学习分类算法，最好从线性的入手，线性分类器最简单的就是LDA，它可以看做是简化版的SVM，如果想理解SVM这种分类器，那理解LDA就是很有必要的了。谈到LDA，就不得不谈谈PCA，PCA是一个和LDA非常相关的算法，从推导、求解、到算法最终的结果，都有着相当的相似。本次的内容主要是以推导数学公式为主，都是从算法的物理意义出发，然后一步一步最终推导到最终的式子，LD...

2018-06-26 17:14:00 2474

转载机器学习特征选择方法

原文链接：点击打开链接3.特征选择当数据预处理完成后，我们需要选择有意义的特征输入机器学习的算法和模型进行训练。通常来说，从两个方面考虑来选择特征：特征是否发散：如果一个特征不发散，例如方差接近于0，也就是说样本在这个特征上基本上没有差异，这个特征对于样本的区分并没有什么用。特征与目标的相关性：这点比较显见，与目标相关性高的特征，应当优选选择。除方差法外，本文介绍的其他方法均从相关性考虑。根据特征...

2018-06-26 16:38:47 5281 1

转载几种常用的特征选择方法

原文链接：点击打开链接特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能：减少特征数量、降维，使模型泛化能力更强，减少过拟合增强对特征和特征值之间的理解拿到数据集，一个特征选择方法，往往很难同时完成这两个目的。通常情况下，我们经常不管三七二十一，选择一种自己...

2018-06-26 15:55:50 18759 4

转载笔试编程题输入输出模板备忘

C++：借用C++中的new/delete#include "stdlib.h"#include <iostream>using namespace std;int main(){ int m, n; //cout << "请输入行和列："; cin >> m >> n; //动态开辟空间 in...

2018-06-26 15:27:22 1426

转载常用激活函数的总结与比较

原文链接：点击打开链接，点击打开链接本文结构：什么是激活函数为什么要用都有什么sigmoid ，ReLU， softmax 的比较如何选择1. 什么是激活函数如下图，在神经元中，输入的 inputs 通过加权，求和后，还被作用了一个函数，这个函数就是激活函数 Activation Function。2. 为什么要用如果不用激励函数，每一层输出都是上层输入的线性函数，无论神经网络有多少层，输出都是...

2018-06-25 23:04:45 4845

转载优化方法总结：SGD，Momentum，AdaGrad，RMSProp，Adam

1. SGDBatch Gradient Descent在每一轮的训练过程中，Batch Gradient Descent算法用整个训练集的数据计算cost fuction的梯度，并用该梯度对模型参数进行更新：Θ=Θ−α⋅▽ΘJ(Θ)Θ=Θ−α⋅▽ΘJ(Θ)优点:cost fuction若为凸函数，能够保证收敛到全局最优值；若为非凸函数，能够收敛到局部最优值缺点:由于每轮迭代都需要在整个数据集上计...

2018-06-25 22:17:01 351

转载推荐系统介绍:(协同过滤)—Intro to Recommender Systems: Collaborative Filtering

原文链接：点击打开链接本文试验前期准备：MovieLens ml-100k数据集Jupyter notebookthemoviedb.org API key 本文试验内容翻译自：http://blog.ethanrosenthal.com/2015/11/02/intro-to-collaborative-filtering/ 添加python引用import numpy as npimpor...

2018-06-25 21:29:56 565

转载协同过滤推荐算法的原理

原文链接：点击打开链接一、协同过滤算法的原理及实现二、基于物品的协同过滤算法详解一、协同过滤算法的原理及实现协同过滤推荐算法是诞生最早，并且较为著名的推荐算法。主要的功能是预测和推荐。算法通过对用户历史行为数据的挖掘发现用户的偏好，基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法分为两类，分别是基于用户的协同过滤算法(user-based collaboratIve filt...

2018-06-25 19:46:45 1520

转载 Boost算法（GDBT,AdaBoost，XGBoost）原理

原文链接：点击打开链接简单地来说，提升Boost就是指每一步都产生一个弱预测模型，然后加权累加到总模型中，然后每一步弱预测模型生成的的依据都是损失函数的负梯度方向，这样若干步以后就可以达到逼近损失函数局部最小值的目标。首先Boost肯定是一个加法模型，它是由若干个基函数及其权值乘积之和的累加，即其中b是基函数，beta是基函数的系数，这就是我们最终分类器的样子，现在的目标就是想办法使损失函数的期望...

2018-06-22 17:19:47 1455

转载理解GB、GBDT、xgboost、lightGBM

GBDT和xgboost在竞赛和工业界使用都非常频繁，能有效的应用到分类、回归、排序问题，虽然使用起来不难，但是要能完整的理解还是有一点麻烦的。本文尝试一步一步梳理GB、GBDT、xgboost，它们之间有非常紧密的联系，GBDT是以决策树（CART）为基学习器的GB算法，xgboost扩展和改进了GDBT，xgboost算法更快，准确率也相对高一些。 1. Gradient boostin...

2018-06-22 16:57:56 678 1

转载机器学习三大神器GBDT、XGBoost、LightGBM

原文链接：点击打开链接本文主要简要的比较了常用的boosting算法的一些区别，从AdaBoost到LightGBM,包括AdaBoost,GBDT,XGBoost,LightGBM四个模型的简单介绍，一步一步从原理到优化对比。AdaBoost原理原始的AdaBoost算法是在算法开始的时候，为每一个样本赋上一个权重值，初始的时候，大家都是一样重要的。在每一步训练中得到的模型，会使得数据点的估计有...

2018-06-21 20:57:44 4314 1

原创 LeetCode#102. 二叉树的层次遍历

给定一个二叉树，返回其按层次遍历的节点值。（即逐层地，从左到右访问所有节点）。例如:给定二叉树: [3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7返回其层次遍历结果：[ [3], [9,20], [15,7]]解题思路：因为输出不是简单的打印出节点内容，需要输出到二维数组中。因此，对队列要进行一下加工，...

2018-06-20 22:17:29 215

原创二叉树的前序、中序、后序遍历—迭代方式

leetcode上的相关题目：前序：https://leetcode.com/problems/binary-tree-preorder-traversal/?tab=Description中序：https://leetcode.com/problems/binary-tree-inorder-traversal/?tab=Description后序：https://leetcode.com/pr...

2018-06-20 21:36:40 391

原创 LeetCode#661. 图片平滑器

包含整数的二维矩阵 M 表示一个图片的灰度。你需要设计一个平滑器来让每一个单元的灰度成为平均灰度 (向下舍入) ，平均灰度的计算是周围的8个单元和它本身的值求平均，如果周围的单元格不足八个，则尽可能多的利用它们。示例 1:输入:[[1,1,1], [1,0,1], [1,1,1]]输出:[[0, 0, 0], [0, 0, 0], [0, 0, 0]]解释:对于点 (0,0), ...

2018-06-19 23:00:35 565

原创 LeetCode#9. 回文数

判断一个整数是否是回文数。回文数是指正序（从左向右）和倒序（从右向左）读都是一样的整数。示例 1:输入: 121输出: true示例 2:输入: -121输出: false解释: 从左向右读, 为 -121 。从右向左读, 为 121- 。因此它不是一个回文数。示例 3:输入: 10输出: false解释: 从右向左读, 为 01 。因此它不是一个回文数。进阶:你能不将整数转为字...

2018-06-19 22:44:27 113

原创 Leetcode#347. 前K个高频元素

给定一个非空的整数数组，返回其中出现频率前 k 高的元素。例如，给定数组 [1,1,1,2,2,3] , 和 k = 2，返回 [1,2]。注意：你可以假设给定的 k 总是合理的，1 ≤ k ≤ 数组中不相同的元素的个数。你的算法的时间复杂度必须优于 O(n log n) , n 是数组的大小。解题思路：先用hash方式统计每个数字的出现频率，而后建立一个长度为k的优先队列（小顶堆），保留出现频率...

2018-06-19 21:34:59 726 1

原创 LeetCode#3. 无重复字符的最长子串

给定一个字符串，找出不含有重复字符的最长子串的长度。示例：给定 "abcabcbb" ，没有重复字符的最长子串是 "abc" ，那么长度就是3。给定 "bbbbb" ，最长的子串就是 "b" ，长度是1。给定 "pwwkew" ，最长子串是 "wke" ，长度是3。请注意答案必须是一个子串，"pwke" 是子序列而不是子串。解题思路：可变滑动窗记录当前子串的长度，

2018-06-19 17:02:03 126

原创 STL之std::set、std::map的lower_bound和upper_bound

map<int,int> m;int x=14;map<int,int>::iterator iter;iter=m.lower_bound(x);//返回比第一个大于或等于x的值的位置，当m为空时，返回m.begin()iter=m.upper_bound(x);//返回比最后一个大于或等于x的值的位置...

2018-06-19 14:48:32 297

转载 Python Numpy中reshape函数参数-1的含义

原文链接：点击打开链接新数组的shape属性应该要与原来数组的一致，即新数组元素数量与原数组元素数量要相等。一个参数为-1时，那么reshape函数会根据另一个参数的维度计算出数组的另外一个shape属性值。下面来举几个例子来理解一下：>>> z = np.array([[1, 2, 3, 4],[5, 6, 7, 8],[9, 10, 11, 12],[13, 14, 15, ...

2018-06-16 11:27:39 1535

转载 Pandas对DataFrame单列/多列进行运算（map, apply, transform, agg）

原文链接：点击打开链接 1.单列运算在Pandas中，DataFrame的一列就是一个Series, 可以通过map来对一列进行操作：[python] view plain copydf['col2'] = df['col1'].map(lambda x: x**2) 其中lambda函数中的x代表当前元素。可以使用另外的函数来代替lambda函数，例如：[python...

2018-06-16 11:18:26 35024

转载使用Git Bash for Windows

原文链接：点击打开链接本篇体验Git Bash在Windows操作系统上的用法。什么是Bash?是一个Shell环境，Bourne Again Shell的缩写。安装git for windows→ http://git-for-windows.github.io/→ Download，选择一个合适的版本→ 安装→ 安装完后有Git Bash, Git CMD, 和 Git GUI这个三个应用程序...

2018-06-15 15:43:15 549

转载 windows下Git BASH安装

下载安装1.从git官网下载一个git安装包，官网下载地址http://www.git-scm.com/download/2.双击安装程序，进入欢迎界面点击【Next >】3.阅读协议，点击【Next >】4.选择安装位置，点击【Next >】5.选择安装组件：这里可以使用默认选项，点击【Next >】图标组件（Additional icons）：选择是否创建桌面快捷方式桌...

2018-06-15 15:42:08 178

转载排序算法之优先级队列与堆排序

原文链接：点击打开链接在很多应用中，我们通常需要按照优先级情况对待处理对象进行处理，比如首先处理优先级最高的对象，然后处理次高的对象。最简单的一个例子就是，在手机上玩游戏的时候，如果有来电，那么系统应该优先处理打进来的电话。在这种情况下，我们的数据结构应该提供两个最基本的操作，一个是返回最高优先级对象，一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue) 。...

2018-06-13 16:12:49 3375

原创 OpenCV的CascadeClassifier

加载方式：face_cascade = cv2.CascadeClassifier(r'face_detector\haarcascade_frontalface_default.xml')gray =cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)faces =face_cascade.detectMultiScale(gray,1.1,5,cv2.CASCADE_...

2018-06-11 22:32:34 1807

转载给出了一个n*n的矩形，编程求从左上角到右下角的路径数（n > =2）

原文链接：点击打开链接给出了一个n*n的矩形，编程求从左上角到右下角的路径数（n > =2），限制只能向右或向下移动，不能回退。例如当n=2时，有6条路径。解：一是利用数学知识，从左上角到右下角总共要走2n步，其中横向要走n步，所以总共就是C2n~n。二是利用递归实现int getTotalPath(int m, int n) { if(m == 1) ...

2018-06-11 17:41:39 2594

转载 dlib window64 py36 whl 安装包下载

无需编译，直接安装whl包省心。https://pypi.python.org/pypi/dlib/19.6.0 下载 dlib-19.6.0-cp36-cp36m-win_amd64.whl 成功安装 dlib 但是import失败之后尝试 pip install dlib==19.6.1 成功解决https://pypi.python.org/pypi/dlib/19.4.0 下载 dlib...

2018-06-11 16:26:07 1593

转载 Python-pip安装库提示UnicodeDecodeError错误

原文链接：点击打开链接问题描述： Win10系统（家庭中文版）在Windows Powershell（管理员）环境下使用pip安装keras提示UnicodeDecodeError错误解决方法：1、进入Windows Powershell2、输入命令CHCP，查看“当前代码页”（由于系统为预装的Windows 10 家庭中文版，“当前代码页”为936，简体中文）3、输入CHCP 65001，修改“...

2018-06-11 15:39:59 955

原创 window 下总是object_detection/protos/*.proto: No such file or directory

这是因为目前的protoc3.5有Bug,换成3.4就好了https://github.com/google/protobuf/releases/tag/v3.4.0另外，记录一个有关“Win7配置和运行TensorFlow:Object_Detection_API步骤”参考链接点击打开链接...

2018-06-11 15:15:24 1191

转载人脸识别经典算法一：特征脸方法（Eigenface）

原文链接：点击打开链接这篇文章是撸主要介绍人脸识别经典方法的第一篇，后续会有其他方法更新。特征脸方法基本是将人脸识别推向真正可用的第一种方法，了解一下还是很有必要的。特征脸用到的理论基础PCA在另一篇博客里：特征脸(Eigenface)理论基础-PCA(主成分分析法) 。本文的参考资料附在最后了^_^步骤一：获取包含M张人脸图像的集合S。在我们的例子里有25张人脸图像（虽然是25个不同人的人脸的图...

2018-06-11 09:13:33 33388 1

转载一篇文章搞懂人脸识别的十个概念

原文链接：点击打开链接实验室研究人脸技术多年，不仅在技术方面有很好的积累，而且在公司内外的业务中有众多应用。在与产品、商务、工程开发同事交流过程中发现：不管是“从图中找到人脸的位置”，或是“识别出这个人脸对应的身份”，亦或是其他，大家都会把这些不同的人脸技术统称为“人脸识别技术”。因此，整理了一些常见人脸技术的基本概念，主要用于帮助非基础研究同事对人脸相关技术有一个更深入的了解，方便后续的交流与合...

2018-06-11 09:10:21 1310

转载目标检测的图像特征提取之（三）Haar特征

原文链接：目标检测的图像特征提取之（三）Haar特征目标检测的图像特征提取之（三）Haar特征1、Haar-like特征 Haar-like特征最早是由Papageorgiou等应用于人脸表示，Viola和Jones在此基础上，使用3种类型4种形式的特征。Haar特征分为三类：边缘特征、线性特征、中心特征和对角线特征，组合成特征模板。特征模板内有白色和黑色两种矩形，并定义该模板的特征值...

2018-06-05 15:18:08 273

转载目标检测的图像特征提取之（二）LBP特征

原文链接：目标检测的图像特征提取之（二）LBP特征目标检测的图像特征提取之（二）LBP特征 LBP（Local Binary Pattern，局部二值模式）是一种用来描述图像局部纹理特征的算子；它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikäinen, 和 D. Harwood 在1994年提出，用于纹理特征提取。而且，提取的特征是图像的局部的纹理特征； ...

2018-06-05 15:14:04 219

转载目标检测的图像特征提取之（一）HOG特征

原文链接：图像特征提取三大法宝：HOG特征，LBP特征，Haar特征（一）HOG特征1、HOG特征：方向梯度直方图（Histogram of Oriented Gradient, HOG）特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中，尤其在行人检测中获得了极大的成功。需要...

2018-06-05 11:43:40 242

原创 softmax相关概念

前言：很早在神经网络那里知识的时候知道，在多分类任务中，最后一层全连接层会用softmax层处理输出的y值，将输出变成一个概率分布，又说道在这里用交叉熵作为代价函数，,,,,，总之，就是概念混乱导致的一头雾水，看了好久也是云里雾里，后来终于看西瓜书仔细推导了一遍逻辑回归的公式，才似乎明白了，今天发现softmax回归这个东西，才算是有点小明白了（还不到大明白）。一下是copy来的正文（其中加了一些...

2018-06-02 16:52:27 2317 2

python安装包basemap-1.2.1-cp37-cp37m-win_amd64.whl

python安装包，basemap-1.2.1-cp37-cp37m-win_amd64.whl和pyproj-2.6.1.post1-cp37-cp37m-win_amd64.whl安装包，亲测有效

2020-05-21

talkingdata-mobile-user-demographics.zip

基于用户app的下载和使用情况预测用户的人口属性（性别和年龄） gender_age：训练和测试集 events, app_events: 当用户使用TakingData SDK时，系统记录的日志。包括经纬度和对应app情况。 phone_brand_device_mode：用户的手机属性数据集介绍：https://www.infoq.cn/article/predict-mobile-users-Kaggle-contest

2020-05-20

PoiMap.zip

百度地图，实现GPS轨迹绘制实现思路： 1.根据经纬度实现车辆轨迹绘制 2.使用百度地图API的两个覆盖物实现，Polyline（折线）绘制轨迹，Marker（图标）绘制小车图标 3.将每两个坐标间连线起来，形成连贯的轨迹线路 4.生成下一个图标后删除上一个绘制的图标，形成小车移动动画感 5.本例使用的是临近的随机坐标点

2020-04-21

citydf.xls

全国340个地级以上城市中心经纬度，经纬度基本在区域中心，请酌情考虑使用，文档为EXCEL文档，方便编辑。

2020-04-17

TMDB 5000 Movie Dataset

数据集包含：tmdb_5000_movies.csv、tmdb_5000_credits.csv是Kaggle平台上的项目TMDB(The Movie Database)，共计4803部电影，主要为美国地区一百年间（1916-2017）的电影作品。 Python分析：https://blog.csdn.net/zhuoyue65/article/details/80285875

2018-10-15

人工智能产品经理

随着人工智能热潮的兴起，企业对人工智能领域产品经理的人才需求也开始井喷，人工智能产品经理成为顺应时代潮流的重要人力资源。实际上，人工智能确实给现有的产品和服务带来了全方位的升级，这也给产品经理从业人员提出了更高的要求，是关注人工智能产品的产品经理们面临的一次关键转型考验。人工智能产品经理的新起点_黄钊互联网产品经理必读

2018-07-20

2017全球人工智能人才白皮书

2017全球人工智能人才白皮书，最新版腾讯研究院自2017年发布8月先后发布《中美两国人工智能产业发展全面解读》和《2017中美人工智能创投现状与趋势研究报告》之后，引起许多读者好评。有读者来研究院走访，建议研究全球人工智能人才分布的课题，以便让公众更好的把握产业发展现状。这个建议得到许多朋友的认同，大家认为，在算法算力数据都得到了较好解决的今天，AI产业的发展，更多的依赖科学家和各层面的科研人员。

2018-07-20

Python项目开发实战（第2版）带标签

目录 · · · · · · 第1部分　Python开发入门　　1 第1章　Python入门　　2 1.1 安装Python　　2 1.1.1 安装deb包　　3 1.1.2 安装第三方包　　4 1.1.3 virtualenv的使用方法　　5 1.1.4 多版本Python的使用　　7 1.2 安装Mercurial　　9 1.2.1 Mercurial概述　　10 1.2.2 安装Mercurial　　10 1.2.3 创建版本库　　11 1.2.4 文件操作　　12 1.3 编辑器与辅助开发工具　　14 1.3.1 编辑器　　14 1.3.2 开发辅助工具　　20 1.4 小结　　22 第2章　开发Web应用　　24 2.1 了解Web应用　　24 2.1.1 Web应用是什么　　24 2.1.2 Web应用与桌面应用的区别　　25 2.1.3 Web应用的机制　　25 2.2 前置准备　　28 2.2.1 关于Flask　　28 2.2.2 安装Flask　　28 2.3 Web应用的开发流程　　29 2.4 明确要开发什么应用　　30 2.4.1 留言板应用的需求　　30 2.4.2 明确必备的功能　　30 2.4.3 明确必备的页面　　31 2.5 页面设计　　31 2.5.1 确定成品页面的形式　　31 2.5.2 编写HTML和CSS　　32 2.6 实现功能　　37 2.6.1 保存留言数据　　37 2.6.2 获取已保存的留言列表　　38 2.6.3 用模板引擎显示页面　　39 2.6.4 准备评论接收方的URL　　42 2.6.5 调整模板的输出　　43 2.7 查看运行情况　　45 2.8 小结　　47 第3章　Python项目的结构与包的创建　　48 3.1 Python项目　　48 3.2 环境与工具　　49 3.2.1 用virtualenv搭建独立环境　　49 3.2.2 用pip安装程序包　　55 3.2.3 小结　　62 3.3 文件结构与发布程序包　　62 3.3.1 编写setup.py　　62 3.3.2 留言板的项目结构　　64 3.3.3 setup.py与MANIFEST.in——设置程序包信息与捆绑的文件　　65 3.3.4 setup.py——创建执行命令　　69 3.3.5 python setup.py sdist——创建源码发布程序包　　71 3.3.6 提交至版本库　　71 3.3.7 README.rst——开发环境设置流程　　73 3.3.8 变更依赖包　　75 3.3.9 通过requirements.txt固定开发版本　　77 3.3.10 python setup.py bdist_wheel——制作用于wheel发布的程序包　　78 3.3.11 上传到PyPI并公开　　79 3.3.12 小结　　85 3.4 小结　　86 第2部分　团队开发的周期　　87 第4章　面向团队开发的工具　　88 4.1 问题跟踪系统　　88 4.1.1 Redmine　　88 4.1.2 安装Redmine　　89 4.1.3 Redmine的设置　　91 4.1.4 插件　　93 4.2 版本控制系统　　94 4.2.1 Mercurial与Redmine的联动　　94 4.2.2 用于生成版本库的插件　　95 4.3 聊天系统　　97 4.3.1 Slack　　97 4.3.2 Slack的特点　　98 4.3.3 Slack做不到的事　　101 4.3.4 Slack的注册　　102 4.4 对团队开发有帮助的工具　　102 4.4.1 Dropbox　　102 4.4.2 Google Drive　　102 4.5 小结　　103 第5章　项目管理与审查　　104 5.1 项目管理与问题的区分使用　　104 5.1.1 项目管理的前置准备工作　　104 5.1.2 创建问题　　105 5.1.3 整理问题　　107 5.1.4 分割问题　　107 5.2 问题模板　　108 5.2.1 安装插件　　108 5.2.2 问题模板的使用方法　　109 5.2.3 Global Issue Templates　　111 5.2.4 问题模板示例　　112 5.3 问题驱动开发　　114 5.3.1 别急着敲代码，先建问题　　114 5.3.2 创建与问题编号同名的分支　　115 5.3.3 让发布与分支相对应　　115 5.3.4 分支的合并　　116 5.4 审查　　117 5.4.1 为什么需要审查　　117 5.4.2 审查委托：代码审查篇　　118 5.4.3 审查委托：作业审查篇　　119 5.4.4 实施审查：代码审查篇　　120 5.4.5 实施审查：作业审查篇　　123 5.5 小结　　123 第6章　用Mercurial管理源码　　125 6.1 Mercurial版本库的管理与设置　　125 6.1.1 服务器上的Uinx用户群设置　　125 6.1.2 创建版本库　　126 6.1.3 hgrc的设置　　127 6.1.4 使用设置好的版本库　　127 6.1.5 使用hgweb建立简易中央版本库　　127 6.2 灵活使用“钩子”　　128 6.2.1 钩子功能的设置方法　　129 6.2.2 尝试钩子脚本　　129 6.2.3 钩子事件　　130 6.2.4 钩子功能的执行时机　　131 6.2.5 编写钩子脚本　　134 6.3 分支的操作　　136 6.4 关于合并　　137 6.4.1 未发生冲突的合并　　138 6.4.2 合并时发生冲突以及用文本编辑器解决冲突的方法　　140 6.4.3 合并的类型与冲突　　143 6.4.4 用GUI的合并工具进行合并　　144 6.5 GUI客户端　　147 6.5.1 GUI客户端的介绍　　147 6.5.2 GUI客户端的优点　　149 6.5.3 GUI客户端的缺点　　151 6.6 考虑实际运用的BePROUD Mercurial Workflow　　152 6.6.1 概述　　152 6.6.2 背景　　152 6.6.3 版本库的结构　　153 6.6.4 提交源码　　154 6.6.5 提交设计　　156 6.6.6 分支的合并　　157 6.6.7 集成分支　　158 6.7 小结　　160 第7章　完备文档的基础　　162 7.1 要记得给项目写文档　　162 7.1.1 写文档时不想做的事　　162 7.1.2 什么样的状态让人想写文档　　164 7.2 Sphinx的基础与安装　　165 7.2.1 Sphinx的安装　　166 7.2.2 reStructuredText入门　　167 7.2.3 用Sphinx写结构化文档的流程　　169 7.2.4 Sphinx扩展　　174 7.3 导入Sphinx可解决的问题与新出现的问题　　175 7.3.1 由于是纯文本，所以能在平时用的编辑器上写文档　　176 7.3.2 信息与视图相分离，所以能集中精神编辑内容，不用顾虑装饰等外观问题　　176 7.3.3 可根据一个源码输出PDF等多种格式　　179 7.3.4 通过结构化，文档可分成几个文件来写　　180 7.3.5 能用Mercurial等轻松实现版本管理　　181 7.3.6 API参考手册与程序的管理一体化　　182 7.3.7 通过Web浏览器共享　　184 7.3.8 导入Sphinx后仍存在的问题　　185 7.4 文档集的创建与使用　　186 7.4.1 什么是文档集　　186 7.4.2 项目所需文档的一览表　　187 7.4.3 面向项目组长、经理　　187 7.4.4 面向设计者　　189 7.4.5 面向开发者　　189 7.4.6 面向客户　　189 7.5 小结　　190 第8章　模块分割设计与单元测试　　191 8.1 模块分割设计　　191 8.1.1 功能设计　　191 8.1.2 构成Web应用的组件　　192 8.1.3 组件设计　　194 8.1.4 模块与程序包　　195 8.2 测试　　197 8.2.1 测试的种类　　197 8.2.2 编写单元测试　　198 8.2.3 从单元测试中剔除环境依赖　　209 8.2.4 用WebTest做功能测试　　215 8.3 通过测试改良设计　　219 8.4 推进测试自动化　　221 8.4.1 用tox自动生成执行测试的环境　　221 8.4.2 可重复使用的测试环境　　223 8.5 小结　　223 第9章　Python封装及其运用　　224 9.1 使用程序包　　224 9.1.1 程序包的版本指定　　224 9.1.2 从非PyPI服务器安装程序包　　226 9.1.3 程序包的发布格式　　228 9.1.4 生成wheelhouse的方法　　230 9.1.5 从wheelhouse安装　　231 9.2 巧用程序包　　232 9.2.1 私密发布　　232 9.2.2 巧用requirements.txt　　232 9.2.3 requirements.txt层级化　　233 9.2.4 为部署和CI+tox准备的requiremests　　234 9.2.5 通过requirements.txt指定库的版本　　235 9.3 小结　　236 第10章　用Jenkins持续集成　　237 10.1 什么是持续集成　　237 10.1.1 持续集成的简介　　237 10.1.2 Jenkins简介　　239 10.2 Jenkins的安装　　239 10.2.1 安装Jenkins主体程序　　239 10.2.2 本章将用到的Jenkins插件　　240 10.3 执行测试代码　　241 10.3.1 让Jenkins运行简单的测试代码　　241 10.3.2 添加Job　　242 10.3.3 Job的成功与失败　　244 10.4 测试结果输出到报告　　246 10.4.1 安装pytest　　246 10.4.2 调用pytest命令　　246 10.4.3 根据pytest更改Jenkins的设置　　246 10.5 显示覆盖率报告　　247 10.5.1 安装pytest-cov　　248 10.5.2 从pytest获取覆盖率　　248 10.5.3 读取覆盖率报告　　248 10.6 执行Django的测试　　250 10.6.1 安装Python模块　　250 10.6.2 Django的调整　　251 10.6.3 示例代码　　251 10.6.4 Jenkins的调整　　255 10.6.5 “构建后操作”选项卡的设置　　257 10.7 通过Jenkins构建文档　　260 10.7.1 安装Sphinx　　261 10.7.2 在Jenkins添加Job　　261 10.7.3 Sphinx构建发出警告时令Job失败　　261 10.7.4 查看成果　　262 10.7.5 通过Task Scanner Plugin管理TODO　　263 10.7.6 Task Scanner Plugin的设置示例　　264 10.8 Jenkins进阶技巧　　265 10.8.1 好用的功能　　265 10.8.2 进一步改善　　267 10.9 小结　　268 第3部分　服务公开　　269 第11章　环境搭建与部署的自动化　　270 11.1 确定所需环境的内容　　270 11.1.1 网络结构　　270 11.1.2 服务器搭建内容的结构化　　272 11.1.3 用户的设置　　273 11.1.4 选定程序包　　274 11.1.5 中间件的设置　　277 11.1.6 部署　　280 11.2 用Ansible实现自动化作业　　282 11.2.1 Ansible简介　　282 11.2.2 文件结构　　287 11.2.3 执行Ansible　　288 11.2.4 与最初确定的结构相对应　　288 11.2.5 将各步骤Ansible化　　289 11.2.6 整理Ansible的执行环境　　295 11.3 小结　　296 第12章　应用的性能改善　　298 12.1 Web应用的性能　　298 12.1.1 Web应用面对大量集中请求时会产生哪些问题　　298 12.1.2 针对高负荷的对策　　299 12.2 评估留言板应用的性能　　300 12.2.1 什么是应用的性能　　300 12.2.2 安装ApacheBench　　300 12.2.3 用ApachBench评估性能　　301 12.3 gunicorn简介　　303 12.3.1 安装gunicorn　　304 12.3.2 在gunicorn上运行应用　　304 12.4 nginx简介　　306 12.4.1 安装nginx　　306 12.4.2 检测nginx的性能　　307 12.5 在nginx和gunicorn上运行应用　　310 12.5.1 gunicorn的设置　　310 12.5.2 nginx的设置　　310 12.5.3 评估nginx+gunicorn的性能　　311 12.5.4 性能比较　　312 12.6 小结　　313 第4部分　加速开发的技巧　　315 第13章　让测试为我们服务　　316 13.1 认识现状：测试的客观环境　　316 13.2 将测试导入开发各个阶段　　317 13.2.1 文档的测试（审查）　　317 13.2.2 测试设计的编写方法（输入与输出）　　320 13.2.3 测试的实施与测试阶段的轮换（做什么，做多少）　　323 13.3 小结：测试并不可怕　　326 第14章　轻松使用Django　　327 14.1 Django简介　　327 14.1.1 Django的安装　　327 14.1.2 Django的架构　　327 14.1.3 Django的文档　　331 14.2 数据库的迁移　　331 14.2.1 什么是数据库的迁移　　331 14.2.2 Django的迁移功能　　332 14.3 fixture replacement　　339 14.3.1 什么是测试配置器　　339 14.3.2 几种不便使用默认配置器的情况　　342 14.3.3 如何使用factory_boy　　343 14.3.4 消除“不便使用默认配置器的情况”　　345 14.4 Django Debug Toolbar　　346 14.5 小结　　353 第15章　方便好用的Python模块　　355 15.1 轻松计算日期　　355 15.1.1 日期计算的复杂性　　355 15.1.2 导入dateutil　　357 15.2 简化模型的映射　　359 15.2.1 模型映射的必要性　　359 15.2.2 映射规则的结构化与重复利用　　360 15.2.3 导入bpmappers　　363 15.2.4 与Django联动　　366 15.2.5 编写JSON API　　367 15.3 图像处理　　369 15.3.1 安装Pillow　　369 15.3.2 图像格式转换　　371 15.3.3 改变图像尺寸　　372 15.3.4 剪裁图像　　374 15.3.5 对图像进行滤镜处理　　375 15.4 数据加密　　377 15.4.1 安装PyCrypto　　377 15.4.2 通用加密系统的加密及解密　　377 15.4.3 公钥加密系统（RSA）的加密与解密　　378 15.5 使用Twitter的API　　382 15.5.1 导入tweepy　　382 15.5.2 添加应用与获取用户密钥　　382 15.5.3 获取访问令牌　　385 15.5.4 调用Twitter API　　385 15.5.5 编写用Twitter认证的系统　　387 15.6 使用REST API　　393 15.6.1 REST简介　　394 15.6.2 导入Requests　　394 15.6.3 导入测试服务器　　394 15.6.4 发送GET请求　　396 15.6.5 发送POST请求　　397 15.6.6 发送JSON格式的POST请求　　398 15.6.7 使用GET/POST之外的HTTP方法　　399 15.7 小结　　400 附录　　401 附录A　VirtualBox的设置　　402 A.1 安装VirtualBox　　402 A.2 新建虚拟机　　403 A.3 备份虚拟机　　404 附录B　OS（Ubuntu）的设置　　407 B.1 安装Ubuntu　　407 B.2 SSH的设置　　417 B.3 中文的设置　　419 B.4 添加用户　　419

2018-07-20

fer2013人脸表情识别数据集

该数据是kaggle2013年一个比赛的数据集，比赛网址为：https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/data 数据包含三个文件：fer2013.bib，fer2013.csv，README

2018-06-24

剑指offer完整版PDF带目录源码（C++和Java版）

目录 · · · · · · 第1章面试的流程 1 1.1 面试官谈面试 1 1.2 面试的3种形式 2 1.2.1 电话面试 2 1.2.2 共享桌面远程面试 3 1.2.3 现场面试 4 1.3 面试的3个环节 5 1.3.1 行为面试环节 5 1.3.2 技术面试环节 10 1.3.3 应聘者提问环节 17 1.4 本章小结 18 第2章面试需要的基础知识 20 2.1 面试官谈基础知识 20 2.2 编程语言 21 2.2.1 C++ 22 2.2.2 C# 27 2.3 数据结构 36 2.3.1 数组 36 2.3.2 字符串 47 2.3.3 链表 55 2.3.4 树 59 2.3.5 栈和队列 67 2.4 算法和数据操作 71 2.4.1 递归和循环 72 2.4.2 查找和排序 78 2.4.3 回溯法 87 2.4.4 动态规划与贪婪算法 93 2.4.5 位运算 98 2.5 本章小结 103 第3章高质量的代码 104 3.1 面试官谈代码质量 104 3.2 代码的规范性 105 3.3 代码的完整性 106 3.4 代码的鲁棒性 132 3.5 本章小结 151 第4章解决面试题的思路 153 4.1 面试官谈面试思路 153 4.2 画图让抽象问题形象化 154 4.3 举例让抽象问题具体化 163 4.4 分解让复杂问题简单化 184 4.5 本章小结 199 第5章优化时间和空间效率 201 5.1 面试官谈效率 201 5.2 时间效率 202 5.3 时间效率与空间效率的平衡 237 5.4 本章小结 254 第6章面试中的各项能力 256 6.1 面试官谈能力 256 6.2 沟通能力和学习能力 257 6.3 知识迁移能力 260 6.4 抽象建模能力 293 6.5 发散思维能力 305 6.6 本章小结 313 第7章两个面试案例 315 7.1 案例一：（面试题67）把字符串转换成整数 316 7.2 案例二：（面试题68）树中两个节点的最低公共祖先 324

2018-01-20

Python数据分析与挖掘实战pdf带标签+源代码

目录 · · · · · · 前言基础篇第1章　数据挖掘基础2 1.1　某知名连锁餐饮企业的困惑2 1.2　从餐饮服务到数据挖掘3 1.3　数据挖掘的基本任务4 1.4　数据挖掘建模过程4 1.4.1　定义挖掘目标4 1.4.2　数据取样5 1.4.3　数据探索6 1.4.4　数据预处理7 1.4.5　挖掘建模7 1.4.6　模型评价7 1.5　常用的数据挖掘建模工具7 1.6　小结9 第2章　Python数据分析简介10 2.1　搭建Python开发平台12 2.1.1　所要考虑的问题12 2.1.2　基础平台的搭建12 2.2　Python使用入门13 2.2.1　运行方式14 2.2.2　基本命令15 2.2.3　数据结构17 2.2.4　库的导入与添加20 2.3　Python数据分析工具22 2.3.1　Numpy23 2.3.2　Scipy24 2.3.3　Matplotlib24 2.3.4　Pandas26 2.3.5　StatsModels27 2.3.6　Scikit-Learn28 2.3.7　Keras29 2.3.8　Gensim30 2.4　配套资源使用设置31 2.5　小结32 第3章　数据探索33 3.1　数据质量分析33 3.1.1　缺失值分析34 3.1.2　异常值分析34 3.1.3　一致性分析37 3.2　数据特征分析37 3.2.1　分布分析37 3.2.2　对比分析40 3.2.3　统计量分析41 3.2.4　周期性分析44 3.2.5　贡献度分析45 3.2.6　相关性分析47 3.3　Python主要数据探索函数50 3.3.1　基本统计特征函数50 3.3.2　拓展统计特征函数53 3.3.3　统计作图函数54 3.4　小结59 第4章　数据预处理60 4.1　数据清洗60 4.1.1　缺失值处理60 4.1.2　异常值处理64 4.2　数据集成64 4.2.1　实体识别64 4.2.2　冗余属性识别65 4.3　数据变换65 4.3.1　简单函数变换65 4.3.2　规范化66 4.3.3　连续属性离散化68 4.3.4　属性构造70 4.3.5　小波变换71 4.4　数据规约74 4.4.1　属性规约74 4.4.2　数值规约77 4.5　Python主要数据预处理函数80 4.6　小结81 第5章　挖掘建模83 5.1　分类与预测83 5.1.1　实现过程83 5.1.2　常用的分类与预测算法84 5.1.3　回归分析85 5.1.4　决策树89 5.1.5　人工神经网络95 5.1.6　分类与预测算法评价100 5.1.7　Python分类预测模型特点103 5.2　聚类分析104 5.2.1　常用聚类分析算法104 5.2.2　K-Means聚类算法105 5.2.3　聚类分析算法评价111 5.2.4　Python主要聚类分析算法111 5.3　关联规则113 5.3.1　常用关联规则算法114 5.3.2　Apriori算法114 5.4　时序模式119 5.4.1　时间序列算法120 5.4.2　时间序列的预处理120 5.4.3　平稳时间序列分析122 5.4.4　非平稳时间序列分析124 5.4.5　Python主要时序模式算法132 5.5　离群点检测134 5.5.1　离群点检测方法135 5.5.2　基于模型的离群点检测方法136 5.5.3　基于聚类的离群点检测方法138 5.6　小结141 实战篇第6章　电力窃漏电用户自动识别144 6.1　背景与挖掘目标144 6.2　分析方法与过程147 6.2.1　数据抽取148 6.2.2　数据探索分析148 6.2.3　数据预处理151 6.2.4　构建专家样本156 6.2.5　模型构建157 6.3　上机实验161 6.4　拓展思考162 6.5　小结163 第7章　航空公司客户价值分析164 7.1　背景与挖掘目标164 7.2　分析方法与过程166 7.2.1　数据抽取168 7.2.2　数据探索分析168 7.2.3　数据预处理169 7.2.4　模型构建173 7.3　上机实验177 7.4　拓展思考178 7.5　小结179 第8章　中医证型关联规则挖掘180 8.1　背景与挖掘目标180 8.2　分析方法与过程181 8.2.1　数据获取183 8.2.2　数据预处理186 8.2.3　模型构建190 8.3　上机实验193 8.4　拓展思考194 8.5　小结194 第9章　基于水色图像的水质评价195 9.1　背景与挖掘目标195 9.2　分析方法与过程195 9.2.1　数据预处理197 9.2.2　模型构建199 9.2.3　水质评价201 9.3　上机实验202 9.4　拓展思考202 9.5　小结203 第10章　家用电器用户行为分析与事件识别204 10.1　背景与挖掘目标204 10.2　分析方法与过程205 10.2.1　数据抽取206 10.2.2　数据探索分析207 10.2.3　数据预处理207 10.2.4　模型构建217 10.2.5　模型检验219 10.3　上机实验220 10.4　拓展思考221 10.5　小结222 第11章　应用系统负载分析与磁盘容量预测223 11.1　背景与挖掘目标223 11.2　分析方法与过程225 11.2.1　数据抽取226 11.2.2　数据探索分析226 11.2.3　数据预处理227 11.2.4　模型构建229 11.3　上机实验235 11.4　拓展思考236 11.5　小结237 第12章　电子商务网站用户行为分析及服务推荐238 12.1　背景与挖掘目标238 12.2　分析方法与过程240 12.2.1　数据抽取242 12.2.2　数据探索分析244 12.2.3　数据预处理251 12.2.4　模型构建256 12.3　上机实验266 12.4　拓展思考267 12.5　小结269 第13章　财政收入影响因素分析及预测模型270 13.1　背景与挖掘目标270 13.2　分析方法与过程272 13.2.1　灰色预测与神经网络的组合模型273 13.2.2　数据探索分析274 13.2.3　模型构建277 13.3　上机实验294 13.4　拓展思考295 13.5　小结296 第14章　基于基站定位数据的商圈分析297 14.1　背景与挖掘目标297 14.2　分析方法与过程299 14.2.1　数据抽取299 14.2.2　数据探索分析299 14.2.3　数据预处理301 14.2.4　模型构建304 14.3　上机实验308 14.4　拓展思考309 14.5　小结309 第15章　电商产品评论数据情感分析310 15.1　背景与挖掘目标310 15.2　分析方法与过程310 15.2.1　评论数据采集311 15.2.2　评论预处理314 15.2.3　文本评论分词320 15.2.4　模型构建320 15.3　上机实验333 15.4　拓展思考334 15.5　小结335

2018-01-09

pandas API英文版（20171212版）

pandas: powerful Python data analysis toolkit Release 0.21.1 Wes McKinney & PyData Development Team Dec 12, 2017

2018-01-05

利用Python进行数据分析pdf中文完整带目录+源代码(py和ipynb)

目录前言 1 第1章准备工作 5 本书主要内容 5 为什么要使用Python进行数据分析 6 重要的Python库 7 安装和设置 10 社区和研讨会 16 使用本书 16 致谢 18 第2章引言 20 来自bit.ly的1.usa.gov数据 21 MovieLens 1M数据集 29 1880—2010年间全美婴儿姓名 35 小结及展望 47 第3章 IPython：一种交互式计算和开发环境 48 IPython基础 49 内省 51 使用命令历史 60 与操作系统交互 63 软件开发工具 66 IPython HTML Notebook 75 利用IPython提高代码开发效率的几点提示 77 高级IPython功能 79 致谢 81 第4章 NumPy基础：数组和矢量计算 82 NumPy的ndarray：一种多维数组对象 83 通用函数：快速的元素级数组函数 98 利用数组进行数据处理 100 用于数组的文件输入输出 107 线性代数 109 随机数生成 111 范例：随机漫步 112 第5章 pandas入门 115 pandas的数据结构介绍 116 基本功能 126 汇总和计算描述统计 142 处理缺失数据 148 层次化索引 153 其他有关pandas的话题 158 第6章数据加载、存储与文件格式 162 读写文本格式的数据 162 二进制数据格式 179 使用HTML和Web API 181 使用数据库 182 第7章数据规整化：清理、转换、合并、重塑 186 合并数据集 186 重塑和轴向旋转 200 数据转换 204 字符串操作 217 示例：USDA食品数据库 224 第8章绘图和可视化 231 matplotlib API入门 231 pandas中的绘图函数 244 绘制地图：图形化显示海地地震危机数据 254 Python图形化工具生态系统 260 第9章数据聚合与分组运算 263 GroupBy技术 264 数据聚合 271 分组级运算和转换 276 透视表和交叉表 288 示例：2012联邦选举委员会数据库 291 第10章时间序列 302 日期和时间数据类型及工具 303 时间序列基础 307 日期的范围、频率以及移动 311 时区处理 317 时期及其算术运算 322 重采样及频率转换 327 时间序列绘图 334 移动窗口函数 337 性能和内存使用方面的注意事项 342 第11章金融和经济数据应用 344 数据规整化方面的话题 344 分组变换和分析 355 更多示例应用 361 第12章 NumPy高级应用 368 ndarray对象的内部机理 368 高级数组操作 370 广播 378 ufunc高级应用 383 结构化和记录式数组 386 更多有关排序的话题 388 NumPy的matrix类 393 高级数组输入输出 395 性能建议 397 附录A Python语言精要 401

2018-01-05

titanic_dataset.csv（泰坦尼克数据集）

Abstract The titanic dataset gives the values of four categorical attributes for each of the 2201 people on board the Titanic when it struck an iceberg and sank. The attributes are social class (first class, second class, third class, crewmember), age (adult or child), sex, and whether or not the person survived. Data Description Origin: natural Usage: assessment Number of attributes: 4 Number of cases: 2,201 Number of prototasks: 1 Number of methods run on this dataset: 3 Contributed by: Radford Neal

2018-01-05

Learning Jupyter 英文高清完整带标签(pdf版和epub版)下载

Learning Jupyter 英文高清完整带标签(pdf版和epub版)下载 pdf版本所有页面使用FoxitReader和PDF-XChangeViewer测试都可以打开 epub版适合kindle爱好者

2018-01-05

DS18B20用LCD1602显示Proteus仿真

PIC16F877单片机开发用ds18b20在lcd1602上实现

2016-01-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人