Day2 Go + RL

一、Go语言学习

之前有编程基础的,可以快速入门,师兄给我推荐了一个网址,可以学习Go语言,两三个小时就能看完。我刚刚做了一个练习题,如下:

练习:循环与函数
为了练习函数与循环,我们来实现一个平方根函数:用牛顿法实现平方根函数。

计算机通常使用循环来计算 x 的平方根。从某个猜测的值 z 开始,我们可以根据 z² 与 x 的近似度来调整 z,产生一个更好的猜测:

z -= (z*z - x) / (2*z)

重复调整的过程,猜测的结果会越来越精确,得到的答案也会尽可能接近实际的平方根。

在提供的 func Sqrt 中实现它。无论输入是什么,对 z 的一个恰当的猜测为 1。 要开始,请重复计算 10 次并随之打印每次的 z 值。观察对于不同的值 x(1、2、3 …), 你得到的答案是如何逼近结果的,猜测提升的速度有多快。

提示:用类型转换或浮点数语法来声明并初始化一个浮点数值:

z := 1.0
z := float64(1)

然后,修改循环条件,使得当值停止改变(或改变非常小)的时候退出循环。观察迭代次数大于还是小于 10。 尝试改变 z 的初始猜测,如 x 或 x/2。你的函数结果与标准库中的 math.Sqrt 接近吗?

注: 如果你对该算法的细节感兴趣,上面的 z² − x 是 z² 到它所要到达的值(即 x)的距离, 除以的 2z 为 z² 的导数,我们通过 z² 的变化速度来改变 z 的调整量。 这种通用方法叫做牛顿法。 它对很多函数,特别是平方根而言非常有效。)

根据提示,很容易就能做出来,我发现当调整阈值为0.000001时, 2 \sqrt2 2 的计算值就与库函数算出来的非常接近了。下面是我自己写的代码:

package main

import (
	"fmt"
	"math"
)

func Sqrt(x float64) float64{
	z := 1.0
	j := 1 //迭代计数器
	threshold := 0.000001
	for z*z - x > threshold || x - z*z > threshold{
		z -= (z*z - x) / (2*z)
		j += 1
	}
	fmt.Println("迭代次数:", j)
	return z
}

func main() {
	fmt.Println(Sqrt(2))
	fmt.Println(math.Sqrt(2))
}

这个学习网站真好,能在线编写运行代码,类似我大一大二的编程课,结果如下:
在这里插入图片描述

二、win10 tensorflow环境

我之前安装了anaconda和pycharm,现在学习强化学习的DQN,在看代码,用到了tensorflow,这里记一下配置过程吧。

1、首先打开Anaconda prompt,用以下命令创建环境:(tf_env是自己起的环境名)

conda create -n tf_env python=3.6

2、激活环境

conda activate tf_env

3、在环境中安装tensorflow

pip install --ignore-installed --upgrade tensorflow==1.2

4、Pycharm中添加interpreter
在这里插入图片描述
这里需要找到创建的tensorflow环境,我的是在:

C:\Users\username\.conda\envs\tf_env

找到后点击那个python.exe添加就好了。

然后重启pycharm,用到tensorflow的DQN代码就可以跑起来了。

5、这时候代码运行还会报错,是缺少一些库,举个例子如下:
在这里插入图片描述
这时需要打开Anaconda prompt,先激活进入tf_env环境,再安装需要的库:

conda activate tf_env
pip install matplotlib
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值