自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

求知:数据科学家之路

爱学习爱女神

  • 博客(18)
  • 收藏
  • 关注

翻译 翻译 | Keras : Deep Learning library for Tensorflow and Theano

看到Kears时,发现代码好简洁,在github上学习了它的帮助文档,很有用处,便翻译过来,留用。翻译不好勿喷。 哈哈Keras 是一个用python写的,能够在Tensorflow或Theano上运行的神经网络库。它被开发用于集中于稳定快速的实验。从idea到结果的关键是做更好的研究,使得更少可能的拖延。如果你需要深度学习库,使用Keras:可以很容易地和快速原型(通过全模块化,简约,和可扩展

2017-02-28 19:34:16 1273

原创 Tensorflow | 简易更新安装说明

随着tensorflow 的不断发展,它的安装也是越来越简单化。这里以我对0.12版本的安装来推广到后续版本的安装,做简单的说明:在windows 下安装,可以采用博文:http://blog.csdn.net/xxzhangx/article/details/54379255 来安装。若是后续有了更新版本,只需一些几步,代码如下:#切换到Scriptsm目录下cd E:\Anaconda3\S

2017-02-27 14:32:15 1103

原创 Tensorflow | 函数名字的更新

Tensorflow 更新到1.0后,一些函数发生了变化,也有些函数迁移到contrib中,在运行代码时易报错。这次仅仅说几个我遇到的名称变化的函数:tf.sub ——> tf.subtracttf.mul ——> tf.multiply后续遇到再更新列表

2017-02-27 10:45:32 4194

原创 tensorflow | 操作函数 和 数据类型

tensorflow中的操作函数数据类型

2017-02-20 22:26:16 914

原创 spark | spark 机器学习chapter3 数据的获取、处理与准备

阅读spark机器学习这本书来学习在spark上做机器学习注意:数据集是电影评分等数据,下载链接:http://files.grouplens.org/datasets/movielens/ml-100k.zip数据集包括:用户属性文件、电影元素、用户对电影的评级 1、将数据解压到某个目录下,并切换到该目录unzip ml-100k.zipcd ml-100k2、查看上述三种数据用户 电影

2017-02-17 17:20:53 693

原创 spark | 读数据

为何要单独一个博文来记录读取数据呢?我觉得读数据很重要,涉及到不同格式的数据,各式各样的情况,故而记之。注意:以python语言为工具读csv格式的 本数据有3列# -*- coding:utf-8 -*- from pyspark import SparkContextsc = SparkContext("local[2]", "First Spark App")# we take t

2017-02-16 23:36:02 425 1

原创 spark | 做基本计算和批量提交

初学spark,就按照书上的来学习1、首先,在ubunu下登录到拥有spark权限的用户下。#以我的为例,我的用户名是hadoopsu hadoop #这里会提示输入密码#切换到spark目录下#cd /home/hadoop/spark2、启动python环境./bin/pyspark3、以一个案例为例子来介绍,数据见底部的百度云链接# -*- coding:utf-8 -*- fr

2017-02-16 22:39:35 1280

原创 spark | 学习记录: 启动Scala、python

初学者,记录学习spark的最基本东西,不忘记在spark下启动scala:./bin/spark-shell测试例子:sc.parallelize(1 to 1000).count()在spark中启动python:./bin/pyspark测试例子:sc.parallelize(range(1000)).count()

2017-02-16 14:26:21 1389

原创 spark | metastore_db cannot be creat

快找工作了,也得把spark和hadoop学起来,于是安装便碰到问题。<console>:14: error: not found: value spark import spark.implicits._ ^<console>:14: error: not found: value spark import spark.sql其原因是没有

2017-02-16 13:24:47 3962 1

原创 python | 解决defaults::qt-5.6.2-vc14_3

在安装tensorflow时需要安装qt,但是报错了,内容如下:ERROR conda.core.link:_execute_actions(330): An error occurred while installing package 'defaults::qt-5.6.2-vc14_3'.UnicodeDecodeError('utf-8', b'\xd2\xd1\xb8\xb4\xd6\x

2017-02-15 13:13:35 5094 1

原创 python | 对时间点的处理

做分析时遇到精确到小时的时间点,需要对月、天、时间来单独分析。以我遇到的一个问题作为例子来说明。 2011-01-01 06:00:00 2011-01-01 07:00:00 2011-01-01 08:00:00 。 。 。等,需要抽出月、天、小时这样的数据单独分析,如何做呢?幸好,pandas可以提供这样的函数。import pandas as pd#读

2017-02-09 20:14:58 928

原创 python | 简单的数据分析

做数据分析的两大利器:python和R语言,这里介绍一个我用python学习的案例第一步,设置工作目录#encoding:utf8import osos.chdir("G:\\Anaconda3\\Scripts\\lecture01\\Feature_engineering_and_model_tuning\\Feature-engineering_and_Parameter_Tuning_

2017-02-09 18:08:28 957

原创 Xgboost | 在Win10中安装

基于对xgboost的学习,R语言版本很好安装,可是python安装版非普通安装方法,根据网上教程,一步步的做下来,终于成功了,故博文记录下来,以供自己或他人查询。注意 : 我的电脑是64位的,32位的安装方法是否雷同,请小心尝试需要的软件:gitmingw64anaconda(做计算常用的python集合软件)第一步 : 安装git https://git-scm.com/downlo

2017-02-07 12:38:18 4258 5

原创 python | pandas 读csv数据报错: 0x8b 解决方案

用pandas 读取csv数据报错了,报错内容如下:读取的代码:import pandas as pd#载入数据:train = pd.read_csv('Train.csv')主要错误是:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x8b in position 2: invalid start byte全部显示信息pandas\p

2017-02-06 23:11:10 11157 6

原创 Kaggle课程 | lecture 1 机器学习算法、工具与流程概述

在july的网站购买了kaggle课程,自己学习并作笔记记录,非给july打广告,只是为了不忘记或自己学习查询。在这里感谢july提供的该课程。下面开始笔记。主要内容 应用领域 常用算法 算法之间的联系 工具 常用scikit-learn ,文本分析用gensim,数据处理用Numpy、matplotlib、pandas,深度学习有tensorflow、caffe、keras解决问题的流程 图

2017-02-06 22:14:06 1083 1

原创 Tensorflow | 回归分析

用tensorflow来做回归分析,基于梯度下降法这里以一元回归分析为例子来说明如何用tensorflow实现回归分析。1、产生数据 采用随机的方式来产生。先基于均值为0,方差为0.9的正态分布产生随机数X,再通过线性变换产生Y,再添加一个均值为0,方差为0.5的噪声。这样便得到数据X和Y。import numpy as np#产生100条数据num_puntos = 100conjunto

2017-02-02 16:59:00 5983

原创 git | git 重新认证

git重新认证,上传代码到本地或克隆本地当你把电脑重现安装或git的认证文件被删除等,git上次代码到github便会报错,这时该如何操作呢?下面看我的另外一篇博文,就可以解决这个问题。http://blog.csdn.net/xxzhangx/article/details/52951592

2017-02-02 15:58:15 5400

原创 python | glob 识别特定格式的文件

python 的第三方包glob识别特定格式的文件在做kaggle的猫狗识别的比赛时,要对图片来分区是猫还是狗,glob包起了很大的作用。下面来用例子说明:from glob import globimport osos.chdir("E:\\Windows.old\\Users\\zhangxiang\\Desktop\\tensorflow_learning\\tensorflowCatV

2017-02-02 15:32:37 3265

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除