花名:白起

科技改变世界,技术改变人生。

共享优秀博文及书单

网上的优秀教程及书籍有很多,之前一直使用收藏夹方式收藏,后来发现越来越多,导致优秀的教程自己也找不到了,本着共享精神,以后将优秀的教程链接及书单名称全部整理到这里,便于自己查找,也共享给其他朋友,共用进步,书单只提供书的名字,建议大家购买正版图书,如果此文有内容侵犯到作者权益,请联系我,最近觉得一...

2017-03-12 10:03:16

阅读数 937

评论数 0

深度学习四大经典书籍

我们都知道现在机器学习、深度学习的资料太多了,面对海量资源,往往陷入到“无从下手”的困惑出境。而且并非所有的书籍都是优质资源,浪费大量的时间是得不偿失的。今天,给大家推荐这四本好书。 1. 《Deep Learning with Python》 推荐指数:★★★★☆ 本书自出版以来收到众多...

2019-02-18 10:05:17

阅读数 8

评论数 0

样本类别不平衡问题之SMOTE算法(Python imblearn极简实现)

类别不平衡问题        类别不平衡问题,顾名思义,即数据集中存在某一类样本,其数量远多于或远少于其他类样本,从而导致一些机器学习模型失效的问题。例如逻辑回归即不适合处理类别不平衡问题,例如逻辑回归在欺诈检测问题中,因为绝大多数样本都为正常样本,欺诈样本很少,逻辑回归算法会倾向于把大多数样本...

2019-01-30 18:17:26

阅读数 67

评论数 0

python写入excel超过65536行报错问题解决方法

接此篇文章:python将txt文件转为excel格式 上篇文章中将内容写到excel中使用import xlwt包,后来发现文件写入超过65536行的时候就会报错,无法转换成功, xls后缀文件,只支持这么多行,在网上搜索一下,解决方法可以写多个sheet页,但不是我想要的方式, 后来后搜...

2019-01-22 10:42:34

阅读数 45

评论数 1

Keras用11行代码构建CNN

卷积神经网络(CNN)是一种特殊的深层的神经网络模型,为什么说它是特殊的神经网络模型呢?一是它的神经元间的连接是非全连接的,另一点是因为同一层中某些神经元之间的连接的权重是共享的。它的这些特点成功的降低了网络模型的复杂度以及减少了权值的数量,这也使得它的网络结构更类似于生物神经网络。今天我们就来用...

2019-01-03 10:52:25

阅读数 62

评论数 0

keras 中的参数属性解释(持续更新)

keras使用过程中会有很多参数及属性,现将日常会用到的做下详解,自己做记录的同时,帮忙其他朋友更好的理解。 一、keras 中的 verbose 详解 fit 中的 verbose verbose:日志显示 verbose = 0 为不在标准输出流输出日志信息 verbose = 1 为输...

2018-12-29 17:03:45

阅读数 584

评论数 2

Linux Anaconda配置Jupyter Notebook远程访问

前面我们安装过Anaconda了,参考 1. 安装ipython, jupyter pip install ipython pip install jupyter 2.生成配置文件 dm@zerotech-All-Series:~$ jupyter notebook --gener...

2018-12-10 16:33:32

阅读数 71

评论数 0

dokuwiki安装方法--适合部门团队共享信息使用

团队之间共享一些信息,每个人都可以看到,使用dokuwiki非常方便、简洁。 确保一下相依套件已经安装 (如未安装 用 yum install 安裝即可 ) yum install  gcc-c++ make expat-devel perl curl-devel libxml2-devel l...

2018-11-28 16:20:11

阅读数 440

评论数 0

hive函数-数学函数 可在特征工程中使用

hive中数据函数可以直接在提取特征中使用,如 均值、方差、最大值、最小值、协方差等,重点关注以下的聚合函数内容。 一、hive函数之数学函数 round(double d)--返回double型d的近似值(四舍五入),返回bigint型; round(double d,int n)--返回保留...

2018-11-05 15:24:41

阅读数 103

评论数 0

hive1.2版本设置队列问题

环境ambari的hadoop集群 使用如下命令设置队列,不生效 set mapreduce.job.queuename=hive; 之后再网上搜索了一下找到原因了,共享给需要的朋友,hive 1.2版本有引擎之说 查看引擎 hive> set hive.executi...

2018-10-11 10:44:32

阅读数 114

评论数 0

python将txt文件转为excel格式

因业务需要,将txt文件转换为excel文件,代码考虑了健壮性,分享一下,代码如下: 使用方法:sh txt2excel.sh file.txt [cl@master txt2excel]$ cat file.txt aaaa bbbb cccc dddd eeee [cl@maste...

2018-08-31 10:23:11

阅读数 342

评论数 3

python数据相关性分析实践

分析特征之间的相关性,得到哪个两个特征的具有关系,这样对于后期的数据分析可以提供帮助。 数据源示例: (每列都是一个特征,每行为一个用户) [10, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 5, 0] [4, 0, 0, 0, 0,...

2018-08-01 14:17:47

阅读数 657

评论数 0

Python数据相关性分析

概述 在我们的工作中,会有一个这样的场景,有若干数据罗列在我们的面前,这组数据相互之间可能会存在一些联系,可能是此增彼涨,或者是负相关,也可能是没有关联,那么我们就需要一种能把这种关联性定量的工具来对数据进行分析,从而给我们的决策提供支持,本文即介绍如何使用 Python 进行数据相关性分析。 ...

2018-07-26 18:37:47

阅读数 274

评论数 0

使用keras进行多分类建模

项目地址:https://github.com/imgoodman/tensorflow-in-action/tree/master/iris-multi-classkeras是用于深度学习的python库,它包含了高效的数值库,以Theano或Tensorflow为后端。这里,使用keras开发...

2018-07-11 17:08:36

阅读数 1318

评论数 0

kaggle比赛 Dogs vs. Cats 使用Keras(Tensorflow)实践

注意:1、代码是在linux环境实践,tensorflow==1.6.0  keras==1.2.2 参考2、ResNet50,Xception,InceptionV3三个模型中,只有ResNet50可以使用,其他的两个无法下载使用3、比赛地址 https://www.kaggle.com/c/d...

2018-07-06 14:26:07

阅读数 725

评论数 0

linux+Anaconda+conda创建Keras(tensorflow)虚拟环境

#root用户安装 [root@node1 ~]#yum install -y lrzsz [root@node1 ~]#yum install -y bzip2 #以下内容可以普通用户安装1、Anaconda安装 Anaconda 安装包可以到清华 https://mirrors.tuna.ts...

2018-07-03 15:03:18

阅读数 1017

评论数 0

陆奇:如何成为一个优秀的工程师?

虽然陆奇离开了,但在他担任 COO 的这段时间里,为百度铺好了一条通往人工智能的轨道,同时他也为百度留下了宝贵的精神财富。今天我们将陆奇曾经的一篇演讲重新发布出来,回顾陆奇在百度的这段时间里,如何贯彻自己成为一个优秀的工程师的理念。一位工程师,如何才能称得上优秀?除了写得一手好 Code,什么样的...

2018-05-22 20:55:02

阅读数 509

评论数 0

特征选择方法

# -*- coding: utf-8 -*- import pandas as pd from sklearn.model_selection import train_test_split import xgboost as xgb data=pd.read_csv('D:\\shop\...

2018-05-21 20:46:50

阅读数 314

评论数 0

SKlearn数据集转换之预处理数据

数据集转换之预处理数据:将输入的数据转化成机器学习算法可以使用的数据。包含特征提取和标准化。原因:数据集的标准化(服从均值为0方差为1的标准正态分布(高斯分布))是大多数机器学习算法的常见要求。如果原始数据不服从高斯分布,在预测时表现可能不好。在实践中,我们经常进行标准化(z-score 特征减去...

2018-05-21 20:33:21

阅读数 288

评论数 0

轻松理解箱形图

箱形图,也叫盒须图,盒式图,boxplot。有95%的把握猜中你现在已经不太确定,这图中有几条线?每条线代表什么意思?中间的那条线代表的究竟是算数平均数还是中位数,还是众数?再问的深点,箱形图存在的意义为何?之于数据分析的实践意义在哪里?接下来,带你从概念开始,一步步剖析箱形图以及背后的故事。1....

2018-04-11 16:41:57

阅读数 717

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭