AI
zhou_zjuer
三墩学院程序员一个,写写代码,发发牢骚,
展开
-
python实现感知机
感知机模型y=f(wx+b) y = f(wx+b) y=f(wx+b)损失函数:L=∑(y−t)2 L = \sum(y - t)^2L=∑(y−t)2∂L∂w=∂L∂y∂y∂w=2(y−t)w \frac{\partial L}{\partial w} = \frac{\partial L}{\partial y}\frac{\partial y}{\partial w} = 2(y-t)w∂w∂L=∂y∂L∂w∂y=2(y−t)w∂L∂b=∂L∂y∂y∂b=2(y−t) \fra原创 2020-05-16 12:10:10 · 337 阅读 · 0 评论 -
蒙特卡洛树搜索-黑白棋(一):黑白棋介绍及棋盘类
这是关于蒙特卡洛树搜索解决黑白棋问题的文章,如果你不了解蒙特卡洛树搜索,参看蒙特卡洛树搜索文章目录1. 黑白棋简介2. 游戏规则3. 棋盘类4.函数具体实现5. 测试1. 黑白棋简介黑白棋(Reversi),也叫翻转棋,是一款经典的策略游戏。一般棋子双面为黑白两色,故称“黑白棋”。因为行棋之时将对方棋子翻转,则变为己方棋子,故又称“翻转棋” (Reversi) 。它使用 8x8 的棋...原创 2020-04-13 15:22:05 · 7728 阅读 · 8 评论 -
蒙特卡洛方法、蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS) 学习
文章目录1. 从多臂赌博机说起2. UCB3. 蒙特卡洛树搜索4. 伪代码提出一个问题:假设你当前有n个币,面前有k个赌博机。每个赌博机投一个币后摇动会产生随机的产出,你会怎么摇?1. 从多臂赌博机说起蒙特卡洛方法利用了一个基本的思想:随机模拟。根据大数定理、多次采样最终得到的样本均值可以估计变量的期望。现代的(随机模拟)统计模拟方法由数学家乌拉姆提出、由Metropolis命名为蒙特...原创 2020-04-13 10:07:55 · 6815 阅读 · 0 评论