自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

【亲身经历】2019杭州人才引进落户——详细流程、地址、所需材料、网上办事链接

首先说一下整体的办理感受:完美(先吹一波)。 不管是从服务态度还是办事效率,好到我都觉得这不是在政府办事了。大部分事情可以在网上办理,政府网站也很给力,基本都是处于更新状态,而不是摆设。 不愧是杭州,一套流程走下来打心底里觉得落户杭州是正确的选择。以后不管是生活还是办理公共事务,肯定非常舒服。 办...

2019-07-28 22:41:03

阅读数 1959

评论数 0

解决xgboost报错 : ValueError: feature_names mismatch

问题原因 已使用训练数据完成xgboost模型的训练,后期应用时,加载完成模型,使用新数据进行预测时报错。 ValueError: feature_names mismatch,具体如下图。 导致这个问题原因可能有多种情况,我这里对我的情况解释一下。 我这里是由于训练数据划分好,使用的 X_tr...

2019-05-20 15:28:11

阅读数 382

评论数 0

【Linux-Ubuntu】免U盘安装windows 和 Ubuntu 18.04 双系统流程,教你避免各种坑

python机器学习和深度学习的很多开源模块在windows下面不好用,一直使用的是虚拟机,但是虚拟机里不敢给太高配置,电脑会卡,所以训练很慢。为了提高使用体验,决定装一个windows和Linux(Ubuntu)的双系统,在装的过程中我真的遇到了非常多的坑,装了不下十次,才最终找到一个最靠谱的安...

2019-05-07 11:49:31

阅读数 9833

评论数 6

【算法】字符串匹配2 BM算法 坏字符规则 好后缀规则 python代码实现

BM算法, Boyer-Moore,非常高效,是KMP算法的3~4倍。 高能预警,此算法较难。 核心思想 匹配过程其实就是模式串在主串中不停地往后滑动。 当遇到不匹配的字符时,BF和RK算法做法是往后滑动一位,从模式串第一个字符重新匹配。 上图中,主串中的 c 其实在模式串中并不存在,所以滑动时...

2019-04-26 17:45:51

阅读数 219

评论数 1

【算法】字符串匹配1 BF算法 RK算法

字符串匹配有多种方法,这里先讲最简单的两种算法: BF算法 和 RK算法,复杂度也相对较高。 它们均为单模式串匹配的算法,也就是一个串跟一个串进行匹配。 BF算法 简介 Brute Force,暴力匹配算法,也叫朴素匹配算法。 比较简单、好懂,但相应的性能也不高。 在字符串 A 中查找字符串 B ...

2019-04-26 17:18:34

阅读数 83

评论数 1

【数据处理】pandas DataFrame 实现 某列中分隔数据转成多行 split explode

DataFrame中某列由“逗号”分隔,格式如下。希望转换后,分隔的行全部以列的形式重新排列。 处理前: 处理后: 转换代码如下。 import pandas as pd df = pd.DataFrame([{'var1': 'a,b,c', 'var2': 1}, ...

2019-04-23 15:10:29

阅读数 563

评论数 0

【算法】图的 深度优先搜索 广度优先搜索 复杂度分析 python代码实现

深度优先搜索算法和广度优先搜索算法都是基于“图”这种数据结构的。 作为图的搜索算法,既可用于有向图,也可用于无向图,以下均用无向图讲解。 广度优先搜索 Breadth-First-Search,BFS。 一种“地毯式”层层推进的搜索策略,先查找离起始顶点最近的,然后是次近的,依次往外搜索。 s 表...

2019-04-10 01:08:55

阅读数 147

评论数 0

【数据结构】图的表示与存储方法 邻接表 邻接矩阵

图是一种非线性表数据结构。 图中的元素我们就叫作顶点(vertex)。 一个顶点可以与任意其他顶点建立连接关系,这种建立的关系叫作边(edge)。 跟顶点相连接的边的条数,叫作顶点的度(degree) 无向图 边没有方向的图就叫作“无向图”。 有向图 边有方向的图叫作“有向图”。 有向图中,把...

2019-04-10 00:49:13

阅读数 53

评论数 0

Linux - Ubuntu 下配置JAVA JVM

下载 假设现在已经在虚拟机中安装好了ubuntu系统,首先去下载 JDK 和 HADOOP 解压配置环境 将压缩包进行解压,放入合适的位置。 tar -zxvf jdk-8u172-linux-x64.tar.gz tar -zxvf hadoop-X.Y.Z-src.tar.g...

2019-04-04 10:41:36

阅读数 118

评论数 0

【算法】理解哈希算法 hash 和常见应用

概念 将任意长度的二进制值串映射为固定长度的二进制值串,这个映射的规则就是 哈希算法。 通过原始数据映射之后得到的二进制值串就是 哈希值。 要求 从哈希值不能反向推导出原始数据 对输入数据非常敏感,一个 Bit 修改得到的哈希值也大不相同 散列冲突的概率要很小 执行效率高效 常见应用 安全加密...

2019-03-19 11:40:56

阅读数 236

评论数 0

【链表】快慢双指针——python解决 链表中环的检测,求单链表的中间结点

在解决链表的很多问题时,设置快慢指针是一个很好的解决思路。 这次解决两个问题: 链表中是否有环结构 求单链表的中间节点 快慢指针的另一个问题 删除链表倒数第n个结点 ,请点击查看。 链表中环的检测 class Node(): def __init__(self, data, next=...

2019-02-28 15:08:25

阅读数 225

评论数 0

【链表】快慢双指针——python解决 删除链表倒数第n个结点

在解决链表的很多问题时,设置快慢指针是一个很好的解决思路。 这次问题的是删除链表倒数第 n 个结点。 例如, 1 -> 2 -> 3 -&am...

2019-02-28 14:12:02

阅读数 163

评论数 0

【数据结构】链表 的介绍与python实现 下篇

【算法与数据结构】链表的介绍与python实现 上篇 【算法与数据结构】链表的介绍与python实现 下篇 上面简单介绍了链表,这篇用python实现链表的基本一些操作。 包括打印链表,插入,删除,查找,翻转。 class Node(): def __init__(self, data, ...

2019-02-27 10:17:10

阅读数 99

评论数 0

【数据结构】链表 的介绍与python实现 上篇

【算法与数据结构】链表的介绍与python实现 上 【算法与数据结构】链表的介绍与python实现 下 本文部分文字图片引用了极客时间的《数据结构与算法之美》链表篇 https://time.geekbang.org/column/article/41013 讲解的很不错的课程,如果有需要可以...

2019-02-27 10:12:26

阅读数 149

评论数 0

【facenet项目】人脸识别相关数据下载(包括 CASIA/LFW/训练模型)

下面的数据是github上的开源项目 facenet 的相关数据下载。 具体请查看项目介绍。 名称 百度网盘地址 密码 20180402-114759 https://pan.baidu.com/s/1_GABHFZfM13K8Qy0a6EIEg chxh 20180408-...

2019-02-11 16:20:04

阅读数 666

评论数 0

一文完全理解模型ks指标含义并画出ks曲线(包含代码和详细解释)

KS(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估, 指标衡量的是好坏样本累计分部之间的差值。 好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。 ——神秘的KS值和GINI系数 上面是ks的简单介绍,相信大家看了这几句话,肯定还是不懂ks到底是个什么。...

2019-01-31 11:44:20

阅读数 3272

评论数 2

ubuntu 18.04 安装NVIDIA驱动 cuda/cudnn + tensorflow-gpu + pytorch

电脑换了华硕新主板,需要重装系统,用的Ubuntu18.04的系统,电脑用的显卡是GTX1080Ti。在新系统中装显卡驱动过程中遇到很多坑,中间无奈搞乱环境又重装了一次系统,再次尝试,终于成功。整个过程失败次数很多,参考的教程感觉自己步步都做对了,但是最后就是不能成功运行。配置系统这种事情确实比较...

2018-12-29 15:35:34

阅读数 3102

评论数 1

conda和pip常用方法,更换源,包的安装、更新、删除、查看

anaconda软件官网下载速度过慢,可以使用清华源的下载地址,https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=A conda和pip可以说各有优劣。pip的模块更全更多,而conda使用更方便,...

2018-12-29 15:29:37

阅读数 4045

评论数 0

【转载】ggplot2主题设置

http://www.rpubs.com/lihaoyi/156592 library(ggplot2) #加载ggplot2包 library(gcookbook) #加载本书的数据包主题theme参数设置改变字体类型、大小,图例、坐标轴、背景等各种元素,可通过theme()函数来完成l...

2018-09-26 10:07:09

阅读数 528

评论数 0

【数据处理】pandas DataFrame 对多个sheet表格的excel 读取、处理、保存

今天一个不太懂编程的朋友让我帮他处理一些excel的表格,要求大概是:有20多个excel表,每个表里有42个sheet表格(sheet数量和名字相同)。最终需要根据对应的sheet名称将所有表格拼接成一个。 为了方式朋友数据泄露,我模拟了一下文件内容,大概如下。不同的excel文件,每个文件中...

2018-09-26 00:46:20

阅读数 18008

评论数 6

提示
确定要删除当前文章?
取消 删除