- 博客(25)
- 收藏
- 关注
原创 猜数字游戏python
import tkinterimport tkinter.messageboximport randomnum_play = 0num_list = [1,2,3,4]def random_list(): global num_list a = [i for i in range(10)] x1 = random.choice(a) a.remove(x1) x2 = random.choice(a) a.remove(x2) x3 =
2021-10-19 19:13:45 1353 2
原创 gym in python
Gym 入门Gym 是一个用于开发和比较强化学习算法的工具包。它不对您的代理结构做任何假设,并且与任何数值计算库兼容,例如 TensorFlow 或 Theano。Gym 库是测试问题(环境)的集合,您可以使用它们来制定强化学习算法。这些环境具有共享接口,允许您编写通用算法。安装首先,您需要安装 Python 3.5+。只需使用 pip 安装gym:pip install gymBuilding from Source如果你乐意,你也可以直接克隆gym git库,当你要修改Gym库本身或者添
2021-08-15 18:33:58 388
原创 蒙特卡罗策略评估
用蒙特卡罗方法来实现策略评估,即给定一个策略,找出价值函数。重点是: for _ in range(100): # generate an episode using pi states, rewards = play_game(grid, policy) G = 0 T = len(states) for t in range(T - 2, -1, -1): s = states[t]
2021-08-13 02:34:18 414
原创 迭代策略评估(决定论)
决定论指的是,agent在某个状态做出一个行为必定到达另一个状态。如果从100楼高的地方,跳楼,百分之百死掉,这是决定论。如果是概率论,则做出一个行为可以能有不同的状态,比如假设有一头熊追我,如果我装睡(action),熊可能不吃我,也可能吃我。迭代策略评估的核心是通过贝尔曼方程更新当前状态的价值,再用新的价值与旧的价值比较,也就是做差值,如果这个差的绝对值小于一个门槛(人为设置),就说明价值函数找到了。为什么是这样?简单点说是靠贝尔曼方程的迭代。本质上是加权求平均值,可以理解为,平均值是一样的,迭
2021-08-11 22:02:30 596
原创 Thompson Sampling(汤普森采样)
1.power socket problem一个robot快没电了,Robot 进入了一个包含 5 个不同电源插座的充电室。这些插座中的每一个都会返回略有不同的电荷量,我们希望在最短的时间内让 Baby Robot 充满电,所以我们需要找到最好的插座,然后使用它直到充电完成。作为介绍,为了让事情更容易处理,让我们简化power socket problem问题。现在,当一个随机变量只有两种可能的结果时,它的行为可以用伯努利分布来描述。用每个socket能充电或不能充电来代替返回会变化数额的电荷。奖励只有
2021-08-04 20:24:38 939
原创 探索和利用困境
假设有两台老虎机,简化成只需要拉杆就能玩,结果只有胜利和失败,胜利为1,失败为2。事先并不知道每台机器的实际胜率,所以只能不断的玩来评估。一开始玩哪一台都一样,胜率都为0,假设我玩第一台,输了。第二次选择玩第二台就很合理。假设玩第二台我赢了,这个时候第一台胜率为0,第二台为100%。这个时候合理的选择是玩第二台,假如之后一直玩第二台,然后一直输,无论如何第二台的胜率都是会高于第一台0。如果是利用,则会选择最优的策略,也就是概率最大的,也就是选择玩第二台。达到收益最大化。如果是探索,则应该有一定几率选到
2021-07-29 05:06:48 226
原创 虚拟机竟然可以这样安装…
mac 上安装 Windows虚拟机1.下载 VirtualBoxVirtualBox downloads page按照电脑版本选择相应的VirtualBox版本。也要下载其中的2.获取windows 10https://developer.microsoft.com/en-us/microsoft-edge/tools/vms/下载MSEdge on Win10 (x64) Stable 1809Choose a VM platform:(选择VirtualBox)之后点击down
2021-07-16 12:21:57 394
原创 python turtle 画图
樱花-python1.导入库2.基本框架3.定义花瓣和树主干的函数import turtleimport timeimport randomt = turtle.Turtle()w = turtle.Screen()t.up()t.left(90)t.backward(200)t.down()w.screensize(bg='wheat')t.color('sienna')def petal(times,t): for i in range(times):
2021-07-04 19:57:42 283
原创 python计算器
python 计算器创建主窗口创建文本输入框和按钮定义运算函数与显示函数import parserfrom tkinter import *from math import factorialroot = Tk()root.title("计算器")i=0def get_variables(num): global i display.insert(i,num) i+=1def clear_all(): display.delete(0,END)
2021-07-04 01:03:13 178
原创 一个c语言系统
一个c语言学生教师信息系统。#include<stdio.h>#include<stdlib.h>#include <string.h>#include<time.h>#include<conio.h>#define MAX_SIZE 100#define NUM 10000#define N 5char username[20]="1"; //初始用户名char password[20]="1234";//初始密码void
2021-06-18 19:20:33 193
原创 机器学习库
机器学习一個很棒的機器學習框架、庫和軟件的精選列表(按語言)。靈感來自於 awesome-php。计算机视觉Scikit-Image - Python 中图像处理算法的集合。Scikit-Opt - Python 中的群智能(Python 中的遗传算法、粒子群优化、模拟退火、蚁群算法、免疫算法、人工鱼群算法)SimpleCV - 一个开源计算机视觉框架,可以访问多个高性能计算机视觉库,例如 OpenCV。用 Python 编写,可在 Mac、Windows 和 Ubuntu Linux 上运行。
2021-06-13 22:21:27 2345 3
原创 c
c函数,知道了压栈,不知道什么意思,函数的执行,定义整型和字符型函数,不需要指定函数类型,系统会自动调成int类型怎么定义函数?数据类型 函数名(参数){}函数的嵌套,函数的递归。函数啊函数。强化学习是什么,强化学习这个东西,像是人类学东西,想达成一个目标,不断的试错,然后逐步优化自己的行为,得到最好的结果。智能体与环境交互。马尔可夫决策过程。当前的状态决定下一时刻的状态,下一时刻的状态只与上一时刻状态有关,而不与之前全部状态有关,上一状态就包括了所有信息。强化学习与监督学习,非监督学
2021-04-16 01:03:13 80
原创 python类学习
关于类的历继承,需要怎么做?class 类名(其他类名,其他类名,…):pass支持多继承。继承了之后就可以使用所父类的方法和属性。但是多继承有个问题,如果继承不同的类中有相同的方法,在前的类的方法会覆盖在后类的方法。不像java或者c++,根据参数和数据类型不同,相同名称的方法是不同的方法。还有一些函数,比如,判断一个类是不是另一个类的父类,判断一个实例是不是一个一个类的实例。还可以判断类继承了那些类。一些名词,接口,多态,继承,多继承,封装。方法就是函数,属性就是变量。...
2021-04-15 14:54:13 84
原创 外星人入侵--外星人群整体移动
import pygame,sysfrom pygame.sprite import Groupfrom settings import Settingsclass Alien(pygame.sprite.Sprite): def __init__(self,screen,ai_settings): super(Alien, self).__init__() self.screen = screen self.ai_settings=a.
2021-03-07 16:08:55 191
原创 pygame发射子弹
发射子弹import sys # 用以退出程序import pygame # import库from pygame.sprite import Groupbg_color = 230,230,230class Ship: def __init__(self,screen): self.screen = screen self.image = pygame.image.load('images/ship.bmp').convert_alpha()
2021-03-04 00:34:19 755 3
原创 做网站
Django终于把一个网站做出来了,虽然是照着书一遍一遍来的。但是网站做了还是有点收获。主题还修改不了第一次遇到的问题多一点,第二次只在一个地方卡了很久。涉及到两行代码:python manage.py makemigrationspython manage.py migrate什么时候该迁移,一开始看起来好像只要是修改了models就要迁移,但是后来又不是这样,而是添加了类需要迁移,在已经有了的类里面改动又不需要。实在有点懵逼。在一个类里面改了一个属性名称,我迁移了,成功改掉了属
2021-02-07 18:59:51 239 1
原创 django
二、使用1.创建虚拟环境(可略)python -m venv [name]2.创建Django项目django-admin startproject [name]再用再进入manage.py 所在目录执行:python manage.py runserver观察是否创建成功3.创建apppython manage.py startapp [name]4.创建超级用户python manage.py createsuperuser接下来会要你输入名字,邮箱,密码。创建好之后
2021-02-03 14:50:47 95
原创 系统性学习
系统性学习广度和深度。要学习软件工程,需要知道第三方库和内置库,知道了还要会用,所以还需要语法,或许还会需要更多的东西。需要一个体系,所以这是系统的学习。费曼学习法:想要掌握一个领域。那么你可以写出一本这个领域的通俗读本。完全没有头绪会卡壳能写出来但是外行听不懂没有头绪说明你学的不够好,会卡壳说明没有理清体系,外行听不懂说明你写的不够深入浅出。DIKW模型数据,信息,知识,智慧什么是数据?比如今天0摄氏度,就是数据。数据经过处理后就是信息越接近本质就是智慧。...
2021-02-03 00:49:29 628 1
原创 豆瓣简单模拟登陆
找url找到登陆接口后,用requests.post()请求该网页URL,之后将得到的cookie存入本地。遇到什么问题?参数问题,在requests的post中要用,data。在get中要用params,这个就搞人了。给我感觉cookie的作用。没有cookie,一些网站是不能爬取的,要爬就需要cookie,那么有些网站必须登陆才有对的cookie可以获取。得到cookie后存入本地。这个登陆接口页面的cookie也就是豆瓣主页的需要的cookie,什么时候cookie会变 我也不知道,我退出豆
2021-01-30 02:44:32 629
原创 python复习
python复习python基础for循环,while循环,感觉也没学到什么,最多的就是爬虫爬虫爬虫呢学了什么,requests、beautifulsoup、xpath、selenium、urllib能爬的基本上不用cookie,要用代理的,存cookie的我基本上都不熟练。而且也没记。爬的还都是图片,小说,一点点容易爬的视频。那些ip代理,反爬虫,线程池,多线程,脑壳疼。还有大型爬虫,还有数据库,操作数据库。还有ajax动态请求,什么什么鬼啊。django做网站,写html文件,还有什么gi
2021-01-18 16:36:46 81
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人