基于神经网络的实战演练(一)-启动,运行与解读TensorFlow

本期主题:启动并运行TensorFlow

参考书籍:

【AO-AZ-90-蜥蜴书-中文版-Hands on Machine Learning with Scikit Learn and Tensorflow】

审核目标:成功跑通蜥蜴书中的前馈神经网络框架,并且成功带入给定的数据集进行分析——注意是实习公司的数据集,不再是原来购买的数据集

 本小节整体框架——TensorFlow

Q1:为什么TensorFlow中有创建图谱这种操作?很本元的一个问题

Q3:batch和epoches的含义是什么

Q2:这里的手动渐变和梯度下降以及自动梯度下降到底是干什么的?用在常规的网络里面是干什么

明白这玩意啥意思了

批量梯度下降和随机梯度下降

 大白话5分钟带你走进人工智能-第十一节梯度下降之手动实现梯度下降代码(6)

梯度下降之手动实现梯度下降和随机梯度下降的代码

000

#借助随机种子,创建模拟训练集
import numpy as np
np.random.seed(1) #随机种子np.random.seed(1)和直接的随机数np.random.randn(100,1)区别在哪里?
X=2*np.random.randn(10000,1)
Y=4+3*X+np.random.randn(10000,1)
X_b=np.c_[np.ones((10000,1)),X]
#print(X_b)

#学习率,迭代次数,样本数和初始化设定
learning_rate=0.1
n_iterations=500
m=10000
theta=np.random.randn(2,1)
count=0

#循环迭代,促成梯度下降--计算梯度的公式——迭代
for iterations in range(n_iterations):
    count+=1
    gradients=1/m*X_b.T.dot(X_b.dot(theta)-Y)
    theta=theta-learning_rate*gradients

print(count)
print(theta)

Q1:固定随机种子np.random.seed(x)和正常的表达式中的随机数np.random,randn(x,x)的区别在哪里?np.random.randn(x,x)中括号的作用是干什么?

 

000


#借助随机种子,创建模拟训练集
import numpy as np
from sklearn.linear_model import SGDRegressor
np.random.seed(1)
X=2*np.random.rand(100,1)
Y=4+3*X+np.random.rand(100,1)
X_b=np.c_[np.ones((100,1)),X]
print(X_b)  #跟Batch gradient descent都是一样的前面模拟随机环境

#设置可变学习率,迭代次数,样本数和初始化设定
t0,t1=5,50
def learning_schedule(t):   #学习率随着t的变化而变化,较为特殊
    return t0/(t+t1)
n_epochs=1000
m=100
theta=np.random.randn(2,1)

#循环迭代,促成梯度下降
learning_rate=0.1
for epoch in range(n_epochs):
    for i in range(m):
        random_index=np.random.randint(m)
        #为了解决维度问题?在索引屈指
        xi=X_b[random_index:random_index+1]
        yi=Y[random_index:random_index+1]
        gradients=2*xi.T.dot(xi.dot(theta)-yi)
        learning_rate=learing_schedule(epoch*m+i)
        theta=theta-learing_rate*gradients

print(theta)

 TensorFlow意义以及其启动运行

 使用Pycharm安装TensorFlow

 为啥要隔离,不用以前的库了呢,非得用再用VirtualEnv再创建一个新环境

 更新完毕,可运行文件.py难以直接找到,已有的库也被全部清空

 但是project interpreter还是可以再调整的

 安装的太方便了

 手动计算渐变与实现梯度下降——基于TensorFlow的函数

 创造第一个计算图谱——基于TensorFlow

 

 如何理解梯度下降法? (qq.com)

 非常实例化的梯度下降

 

 创建这块出了点问题

 

 自动计算梯度

 使用优化器——所有这一块跟前面的是做出了什么样的衔接


#使用函数训练
#以mse最小化为目标进行optimizer的训练

# x=tf.train.xxxoptimizer(learning_rate=learning_rate)
# training_op=x.minimize(mse)

optimizer=tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
traning_op=optimizer.minimize(mse)

 使用MINIBATCH,小批量梯度下降

import pandas
import numpy as np
from sklearn.datasets import fetch_california_housing
from sklearn.preprocessing import StandardScaler
import tensorflow as tf

#加载数据
housing=fetch_california_housing()
scale=StandardScaler()
m,n=housing.data.shape
scaled_housing_data=scale.fit_transform(housing.data)
print("数据集:{}行,{}列".format(m,n))
housing_data_plus_bias=np.c_[np.ones((m,1)),scaled_housing_data]

n_epochs=1000
learning_rate=0.01

X=tf.placeholder(tf.float32,shape=(None, n+1),name="x")
Y=tf.placeholder(tf.float32,shape=(None, 1),name="y")
theta=tf.Variable(tf.random_uniform([n+1,1],-1.0,1.0,seed=42),name="theta")
y_pred=tf.matmul(X, theta, name="predictions")
error=y_pred-Y
mse=tf.reduce_mean(tf.square(error),name="mse")
optimizer=tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
trainging_op=optimizer.minimize(mse)

init=tf.global_variables_initializer()

n_epochs=10
batch_size=100
n_batched=int(np.ceil(m/batch_size))    #ceil()方法返回x的值上限

def fetch_batch(epoch,batch_index,batch_size):
    know=np.random.seed(epoch*n_batched+batch_index)
    print("know的值:",know)
    indices=np.random.randint(m,size=batch_size)
    X_batch=scaled_housing_data_plus_bias[indices]
    Y_batch=housing.target.reshape(-1,1)[indices]
    return X_batch,Y_batch

with tf.Session() as sess:
    sess.run(init)

    for epoch in range(n_epochs):
        for batch_index in range(n_batched):
            X_batch, Y_batch=fecth_batch(epoch,batch_index,batch_size)
            sess.run(training_op,feed_dict={X:X_batch,Y:Y_batch})

    best_theta=theta.eval()

print(best_theta)

 

 Q1:xx.data.shape?
m,n=xx.data.shape
shape输出二元组可以保证满足

https://www.sogou.com/link?url=hedJjaC291OB0PrGj_c3jHF3JVBxwgdKnSC852Hk8j4ptVTizOIthLBn4VA8J3SxhEDcdNnX8Dq4HbByHzFTmw..

numpy扩展与填充

 

 

 

 

 Q2:np.c_[np.ones((m,1)), xx]

注意区分array形成的数组没有逗号,区分于数组
reshape重塑表内的元素

 

 Q4:tf.constant(),
Q9:tf.Session()  sess:
Q10:sess.run()

 同问

 我怎么感觉tf这么麻烦,创个计算的优势呢

 Q7:matmul(tf.transpose(),error)找不到,好像懂了一点以前的图计算

Q8:assign(xx,xx-learning_rate*gradients)
内部做函数变化,以生成新的列表

图解Pandas的宝藏函数:assign

这篇深入浅出pandas值得学一学

 这篇的assign()新增函数也值得学习

pandas得敢去做,敢去尝试,才能熟练

 

 

 

 还需要多学习一下文本内容的pandas操作,特别是检索相应数值是否包含在对应的列表中

 apply()和assign()的函数操作差不多

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值