- 博客(22)
- 资源 (12)
- 收藏
- 关注
翻译 python numpy库学习
numpy的常用函数数组的维度变换.reshape(shape) : 不改变当前数组,依shape生成 .resize(shape) : 改变当前数组,依shape生成 数组的类型变换数据类型的转换 :a.astype(new_type) : eg, a.astype (np.float) 数组向列表的转换: a.tolist() 一维数组切片a = np.array ([9...
2018-09-06 14:54:48 262
翻译 python pandas常用函数学习
从网上看的一些资料学习一下,有的内容是直接从其他文章中粘贴过来的。pandas 有两个主要的数据结构:Series 和 DataFrame:1. Series 是一个一维数组对象 ,类似于 NumPy 的一维 array。它除了包含一组数据还包含一组索引,所以可以把它理解为一组带索引的数组。将 Python 数组转换成 Series 对象:(当没有显示指定索引的时候,Series 自动...
2018-09-05 09:52:01 9776
原创 python coo_matrix的理解和用法
1. 理解和用法首先ffm格式(主key,副key,1)数据如下:第一列是lable,后面是x(特征值)举例2:3:1表示 源数据第2列,索引为3源数据test.txt:(其中第8列是连续型特征没有离散化,其他列是离散型特征)1 2:3:1 3:5:1 5:7:1 7:10:1 8:14:1.20 1:1:1 2:4:1 6:9:1 7:10:1 8:14:2.31 2:3:1...
2018-09-04 15:11:59 15627 2
原创 python Sklearn实现xgboost的二分类和多分类
二分类:train2.txt的格式如下:import numpy as npimport pandas as pdimport sklearnfrom sklearn.cross_validation import train_test_split,cross_val_scorefrom xgboost.sklearn import XGBClassifierfrom sklearn.m...
2018-04-10 09:48:01 16654 2
原创 sklearn实现随机森林算法(RF)
import numpy as npimport pandas as pdfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics import precision_score,roc_auc_score'''导入数据的过程,可以直接读取csv文件,通过X_train,X_test, Y_
2018-01-23 14:59:02 5797
原创 ubuntu 下将python项目打包实现方法
1. 环境ubuntu,python3.52.目的:将python项目打包成类库,供其他项目下载安装后,import便可使用3.打包方法:1)在项目下新建文件setup.py(源码如下)from distutils.core import setupsetup(name="churn", #包名称 version="1.0", #版本号 descri
2018-01-11 14:25:33 5607
原创 python的BeautifulSoup实现抓取网页数据
1环境:pycharm,python3.42.源码解析import requestsimport refrom bs4 import BeautifulSoup#通过requests.get获取整个网页的数据def getHtmlText(url): try: r = requests.get(url) # to che
2018-01-10 16:55:33 1961
原创 深度学习:sklearn实现LR(逻辑回归)算法实例笔记
1.环境:ubuntu ,python3.4,pycharm2.数据格式:3.源码:import sklearnimport numpy as npimport pandas as pdfrom sklearn.cross_validation import train_test_splitfrom sklearn.linear_model import LogisticRegression'''...
2018-01-09 15:36:05 7673
原创 LR学习笔记
1.基础概念介绍逻辑回归(Logistic Regression, LR)模型,回归是一种极易理解的模型,就相当于y=f(x),表明自变量x与因变量y的关系。最常见问题有如:通过用户的一些特征,性别,职业,近期购买记录等特征预测用户是否会购买某个商品,其中的用户特征就是自变量x,即特征数据,判断是否购买就相当于获取因变量y,即预测分类。(0不买,1购买)使用场景:当你的目标变量是分类变
2018-01-05 12:46:40 516
原创 ubuntu14.04安装protobuf
1、下载安装包下载安装包:http://download.csdn.net/download/ping550/100378042、解压安装包#tar -zxf protobuf-2.5.0.tar.gz3、创建安装路径#mkdir /usr/local/protobuf-2.5.0 #cd/usr/local/protobuf-2.5.04、配置安装#/opt/pr
2017-10-24 15:43:38 512
原创 Ubuntu 14.04搭建CDH5*的方法
Ubuntu 14.04搭建CDH5*的方法:第一步:机器配置三台机器的ip和hostname为192.168.10.236 hadoop-1 192.168.10.237 hadoop-2 192.168.10.238 hadoop-3 我们将hadoop-1作为主节点第二步:配置三台机器的hosts文件vim /etc/hosts 192.168.10.236
2017-10-20 11:00:05 508
原创 CDH遇到问题点滴记录
关于CDH和ClouderaManagerCDH (Cloudera's Distribution,including Apache Hadoop),是hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的ApacheHadoop构建,并集成了很多补丁,可直接用于生产环境。 Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监
2017-10-20 10:59:27 407
原创 hive学习笔记第一篇
Hive学习篇安装安装hadoo,本实例中hadoop在/usr/local/hadoop下Hive安装在/home/Hadoop/app/hive下参考文档:http://blog.csdn.net/xiaoshunzi111/article/details/51889486 测试练习以及遇到的问题:开启hadoopcd /usr/local/hadoop/sbi
2017-10-20 10:42:23 477
原创 Ubuntu 14.04 搭建CDH5*笔记
Ubuntu 搭建CDH5*的方法:第一步:机器配置三台机器的ip和hostname为192.168.10.236 hadoop-1 192.168.10.237 hadoop-2 192.168.10.238 hadoop-3 我们将hadoop-1作为主节点第二步:配置三台机器的hosts文件vim /etc/hosts 192.168.10.236 hadoo
2017-08-31 15:23:18 619
原创 数据库主从配置
主服务器:Ubuntu14.04从服务器:win7首先将主服务器上的表都复制到从服务器上,保证主服务器的数据库在从服务器上是一直的。主服务器(ubuntu)配置1修改主服务器master: #vi /etc/my.cnf 也可能在/etc/mysql/my.cnf [mysqld] log-bin=mysql-bin //[必
2017-08-31 15:20:06 285
原创 深度学习之CNN
1.熟悉各收敛函数:通常 我们知道 因为relu 收敛效果要比sigmod 与tanh 要好,所以在cnn中常用relu,所以 其实 对于输出o=relu(wx+b) ,sigmod函数的数学公式为: Θ(x)=11+e−x 函数取值范围(0,1),ReLU(校正线性单元:Rectified Linear Unit)激活函数max(0,x)={0,x,if
2017-03-22 15:06:20 308
原创 深度学习笔记-模型参数理解
假设数据集1000个训练集:1000*80%=800, 800*0.9=720进行训练预测得到一个预测的y值,然后和真实的y值(800*0.1=80)进行比较,不断修改,训练测试集:1000*20%=200,待模型训练好后,用测试集进行测试,用200*0.9=180个值预测得到一个预测值,然后和真实值200*0.1=20比较
2017-03-14 09:45:12 527
原创 深度学习 LSTM
第一要明确的是神经网络所处理的单位全部都是:向量常规Recurrent (RNN/LSTM/GRU) 输入和输出:张量输入张量形状:(time_steps, n_samples, dim_input)输出张量形状:(time_steps, n_samples, dim_output)注:同样是保留了Mini-batch gradient descent的训练方式,但不同之处在于
2017-03-09 11:05:13 2412
原创 深度学习笔记四循环神经网络RNN
前面学习了TensorFlow框架下的基础模型,以及一些基础知识。下面学习一下RNN模型 1.在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的RNNs之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的
2017-02-24 10:14:02 317
原创 深度学习比较三Softmax回归学习
前两节学习了基础建模,遇到了mnist,softmax回归问题;下面开始学习softmax回归问题:1.我们也需要加入一个额外的偏置量(bias),因为输入往往会带有一些无关的干扰量。因此对于给定的输入图片 x 它代表的是数字 i 的证据可以表示为其中 代表权重, 代表数字 i 类的偏置量,j 代表给定图片 x 的像素索引用于像素求和。然后用softmax函数可以把这些证据转
2017-02-23 10:48:41 459
原创 深度学习笔记二基于tensorflow的MNIST学习
由于昨天看了TensorFlow的基础模型,遇到了mnist数据库的问题,今天先阅读材料,学习一下。1.MNIST数据库是一个手写数字的数据库,它提供了六万的训练集和一万的测试集2.它的图片是被规范处理过的,是一张被放在中间部位的28px*28px(28*28个像素点)的灰度图3.每张图片都带有一个标签,例如这张图片是1,他的标签就是1,标签不是用数字表示,而是用标签表示,例如1表示成
2017-02-23 09:23:16 347
原创 深度学习笔记一
一些学习网站记下来http://deeplearning.net/tutorial/contents.htmlhttps://github.com/aymericdamien/TensorFlow-Exampleshttps://www.tensorflow.orghttp://mp.weixin.qq.com/s/qmm1xyvnHvWhuUvd9lD
2017-02-22 10:23:52 4112
java链接mysql的驱动包 mysql-connector-java-5.1.29-bin
2017-10-16
vc实现的捕捉方块游戏
2011-04-30
vc实现的模拟手机功能
2011-04-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人