自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 问答 (1)
  • 收藏
  • 关注

原创 大数据&算法工程师知识点大全

下面内容为自己找工作的过程中,自己整理的知识点以及从别人面经中整理的知识点大全,对其中的大部分问题,我都会给出我认为最优答案的csdn链接(ps:本篇博客正在整理过程中,会不定期更新一些新的知识点的答案,希望可以帮到更多的同学!最新更新于2019-9-25)【1】在github上找到了一个2018/2019/校招/春招/秋招/自然语言处理(NLP)/深度学习(Deep Learning)/机...

2018-04-04 10:53:08 4384 1

原创 Windows10中使用Anaconda安装keras-gpu版本【入坑经验总结】

【注】本教程是在已经安装tensorflow-gpu1.7.0基础上,安装keras-gpu版本的一些经验!第一次安装keras的时候,也不清楚什么cpu版本的还有gpu版本的,就百度按照别人的方法直接使用命令conda install keras进行安装,结果。。。它弹出来了提示说还需要附带安装theano以及tensorflow1.1.0版本以及其他几个库,什么也不懂,就同意了,结果在跑ker...

2018-04-26 14:02:40 11299 2

转载 Windows环境下安装TensorFlow并在Jupyter notebook上使用

在成功安装tensorflow之后,在Anaconda Prompt中activate tensorflow之后,输入python,再输入import tensorflow as tf可以正确运行,但是在jupyter notebook上import的时候一直报错说找不到tensorflow模块,网上找了找解决办法,发现是我们只有在tensorflow环境下才可以打开notebook才可以正确im...

2018-04-26 11:44:49 1248

原创 windows10 64位 Tensorflow安装--CUDA 9.1+cuDNN7.1+python3.6.4+tensorflow-GPU1.7.0安装详解

一、前言vs2017安装请见博主文章:vs2017安装和使用教程(详细)Anaconda安装可见博主文章:Anaconda安装二、改动1.我在Anaconda文章里写的Tensorflow是针对于CUDA8.0来说的,因此安装的是py3.52.CUDA9.0是官方Tensorflow的最新版本,那么好不容易装好的CUDA9.1就泡汤了。但是,世上无难事,只怕有心人!3.接下来我为大家展示CUDA9...

2018-04-25 23:36:22 3055

转载 关于jupyter notebook的kernel error的问题

最近打开jupyter notebook发现内核错误【kernal error】 FileNotFoundError: [WinError 2] The system cannot find the file specified,查了资料原来是我中午用conda删除了一些环境,所以牵涉到这个jupyter notebook,可能是路径问题,导致文件找不到。最终找到解决方法:在cmd运行:pytho...

2018-04-25 23:30:42 3151

原创 windows10下使用nvidia-smi查看GPU使用情况

nvidia-smi所在的位置为:C:\Program Files\NVIDIA Corporation\NVSMIcmd进入目录输入命令即可:具体如下所示:重要的参数主要是温度、内存使用、GPU占有率,具体如下红框所示。...

2018-04-25 18:38:47 35551 7

原创 OneHotEncoder独热编码和 LabelEncoder标签编码

学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别。首先了解机器学习中的特征类别:连续型特征和离散型特征            拿到获取的原始特征,必须对每一特征分别进行归一化,比如,特征A的取值范围是[-1000,1000],特征B的取值范围是[-1,1].如果使用logistic回归,w1*x1+w2*x2...

2018-04-19 16:30:37 4312

转载 pandas使用get_dummies进行one-hot编码

离散特征的编码分为两种情况:1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}使用pandas可以很方便的对离散型特征进行one-hot编码[python] view plain copyimport pandas as pd...

2018-04-19 14:17:53 574

原创 Windows安装XGBoost详细教程

折腾了半天,终于把xgboost在自己电脑装好了【只是表面装好了,但是还是import的时候出现各种问题】网上有很多帖子说的方法都是自己要下载git,还要下载mingw32等软件,目的只有一个,就是为了编译从github上下载的xgboost源码,自己尝试了好多次都失败了,后来直接下载别人已经编译好的xgboost文件,在安装就可以了,具体过程如下:附加1:python各版本,32位及64位下载地...

2018-04-17 18:24:15 1499

转载 自然语言处理资源及机器学习面试题目大全

先说说面试,我深深的觉得刷题检验自己知识和巩固知识的方式,推荐如下:那些深度学习《面试》你可能需要知道的如何准备机器学习工程师的面试 ?七月在线实验室---BAT机器学习面试题如何准备机器学习工程师的面试 ?读完这21个机器学习面试问题和答案,入职率提升99%....等等我觉得上面很多问题可以很好的检查下自己掌握那些算法到什么样的水平。然后是推荐我学自然语言处理时的书籍和教材,我觉得自然语言工程师...

2018-04-11 10:42:35 3607

转载 B 树、B- 树、B+ 树和B* 树

B树即二叉搜索树:1. 所有非叶子结点至多拥有两个儿子(Left和Right);2. 所有结点存储一个关键字;3. 非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树;如:B树的搜索,从根结点开始,如果查询的关键字与结点的关键字相等,那么就命中;否则,如果查询关键字比结点关键字小,就进入左儿子;如果比结点关键字大,就进入右儿子;如果左儿子或右儿子的指针为空,则报告找不到相应的关...

2018-04-09 10:31:29 204

转载 Pandas速查手册中文版

本文翻译自文章:Pandas Cheat Sheet - Python for Data Science,同时添加了部分注解。对于数据科学家,无论是数据分析还是数据挖掘来说,Pandas是一个非常重要的Python包。它不仅提供了很多方法,使得数据处理非常简单,同时在数据处理速度上也做了很多优化,使得和Python内置方法相比时有了很大的优势。如果你想学习Pandas,建议先看两个网站。(1)官网...

2018-04-08 21:32:35 697

转载 决策树之剪枝原理与CART算法

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u014688145/article/details/53326910决策树学习笔记(二)前言继续关于决策树的内容,本篇文章主要学习了决策树的剪枝理论和基于二叉树的CART算法。主要内容:理解决策树损失函数的定义以及物理含义基尼指数的主要两个作用理解CART剪枝原理,以及它的基本假设和核心思想决策树的...

2018-04-04 19:37:01 1380

转载 深度学习入门

零基础入门深度学习(1) - 感知器 零基础入门深度学习(2) - 线性单元和梯度下降 零基础入门深度学习(3) - 神经网络和反向传播算法 零基础入门深度学习(4) - 卷积神经网络 零基础入门深度学习(5) - 循环神经网络 零基础入门深度学习(6) - 长短时记忆网络(LSTM) 零基础入门深度学习(7) - 递归神经网络深度学习论文学习路线(Deep Learning Papers Rea...

2018-04-03 20:22:42 1868 1

转载 程序员面试、算法研究、编程艺术、红黑树、机器学习5大系列集锦

程序员面试、算法研究、编程艺术、红黑树、机器学习5大经典原创系列集锦与总结 (七月在线:https://www.julyedu.com/,面试 & 算法 & 机器学习在线课程)作者:July--结构之法算法之道blog之博主。时间:2010年10月-2014年12月。出处:http://blog.csdn.net/v_JULY_v 。说明:本博客中部分文章经过不断修改、优化,已集结...

2018-04-03 14:31:59 262

转载 从头到尾解析Hash表算法

作者:July、wuliming、pkuoliver  出处:http://blog.csdn.net/v_JULY_v。  说明:本文分为三部分内容,    第一部分为一道百度面试题Top K算法的详解;第二部分为关于Hash表算法的详细阐述;第三部分为打造一个最快的Hash表算法。------------------------------------ 第一部分:Top K 算法详解问题描述百...

2018-04-03 14:25:13 203

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除