- 博客(112)
- 资源 (4)
- 收藏
- 关注
原创 Tensorflow(十二) —— Tensor的限幅
Tensorflow(十二) —— Tensor的限幅1. 主要方法2. clip_by_value方法3. relu函数4. clip_by_norm方法5. Gradient Clipping方法6. Gradient Clipping 实战 (不设置梯度限幅)7. Gradient Clipping 实战 (设置梯度限幅)1. 主要方法1、clip_by_value2、relu3、clip_by_norm4、gradient clipping2. clip_by_value方法# *
2022-04-16 13:55:32 268
原创 Tensorflow(十一) —— Tensor的填充与复制
Tensorflow(十一) —— Tensor的填充与复制1. 主要方法2. pad方法3. tile方法4. tilt 与 broadcast_to的区别1. 主要方法1、pad2、tile3、broadcast_to2. pad方法import numpy as npimport pandas as pdimport tensorflow as tf"""tf.pad(a,[[a11,a12],[a21,a22],...)指定每个轴的前面填充a11条数据,后面填充a12条数据
2022-04-16 13:50:02 1753
原创 Tensorflow(十) —— Tensor的排序
Tensorflow(十) —— Tensor的排序1. 主要方法2. sort与argsort3. top_k4. Top_k用于Accuracy5. top_k 用于accuracy 的完整案例1. 主要方法1、sort / argsort2、top_k :tf.math.top_k3、top5 用于ACC2. sort与argsortimport numpy as npimport pandas as pdimport tensorflow as tf# **********
2022-04-16 13:47:18 1669
原创 Tensorflow(九) —— 数据统计的方式
Tensorflow(九) —— 数据统计的方式1. 主要方法2. 向量的范数3. reduce_min、reduce_max、reduce_mean4. argmax、argmin5. tf.equal6. tf.unique1. 主要方法1、tf.norm(范数)2、tf.reduce_min tf.reduce_max3、tf.argmax tf.argmin4、tf.equal Tensor的比较(元素比较)5、tf.unique Tensor的独特值2. 向量的
2022-04-16 13:42:51 533
原创 Tensorflow(八) —— Tensor的合并与切割
Tensorflow(八) —— Tensor的合并与切割1. 主要操作方式2. concat操作3. stack操作4. concat 与 stack 的区别5. unstack & stack 为可逆操作6. split操作1. 主要操作方式1、tf.concat # 常用2、tf.split # 常用3、tf.stack # 常用4、tf.unstack2. concat操作指定axis则沿该轴进行拼接# ********************* conca
2022-04-16 13:37:41 1797
原创 Tensorflow(七) —— 前向传播的实战
Tensorflow(七) —— 前向传播的实战1. 解决tensorflow输出无关信息问题2. 加载数据并转换类型3. 数据分割成不同batch4. 定义权值和偏置为:Tensor类型的Variable5. 定义学习率6. 权值训练1. 解决tensorflow输出无关信息问题import tensorflow as tfimport os from tensorflow.keras import datasetsfrom tensorflow import keras# 解决tens
2022-04-16 13:29:25 393
原创 强化学习—— 离散与连续动作空间(随机策略梯度与确定策略梯度)
强化学习—— 离散与连续动作空间(随机策略梯度与确定策略梯度)1. 动作空间1.1 离散动作空间1.2 连续动作空间1. 动作空间1.1 离散动作空间比如:{left,right,up}\{left,right,up\}{left,right,up}DQN可以用于离散的动作空间(策略网络)1.2 连续动作空间比如:A=[0∘,180∘]∗[0∘,360∘]A=[0^{\circ} ,180^{\circ} ]*[0^{\circ} ,360^{\circ} ]A=[0∘,180∘]∗[0
2022-04-12 23:42:17 11488 1
原创 强化学习—— 基于baseline的策略梯度(Reinforce算法与A2C)
强化学习—— 基于baseline的策略梯度(Reinforce算法与A2C)1. baseline的推导2. 策略梯度的蒙特卡洛近似3. baseline的选取4. Reinforce算法4.1 基本概念4.2 算法的训练流程1. baseline的推导策略网络为:π(a∣s;θ)\pi(a|s;\theta)π(a∣s;θ)状态价值函数为:Vπ(s)=EA∼π[Qπ(A,s)]=∑aπ(a∣s;θ)⋅Qπ(a,s)V_\pi(s)=E_{A\sim\pi}[Q_\pi(A,s)]\\=\sum
2022-04-12 14:34:54 923
原创 强化学习—— 多智能体强化学习
强化学习—— 多智能体强化学习1. 多智能体关系分类1.1 合作关系(Fully Cooperative)1.2 竞争关系(Fully Competitive)1.3 混合关系(Mixed Cooperative & Competitive)1.4 利己关系(self-interested)2. 专业术语(Terminologies)2.1 假设agent个数为2.2 状态为2.3 第i个agent的动作为2.4 状态转移函数2.5 奖励(Reward)2.6 回报(Return)2.7 策略
2022-04-11 12:44:27 10433 7
原创 强化学习—— Dueling Network
强化学习—— Dueling Network1、优势函数(Advantage Function)1.1 概念定义1.2 优势函数的性质2. Dueling Network2.1 近似网络2.2 训练过程3 网络保留优势函数最大值的原因:解决不唯一性1、优势函数(Advantage Function)1.1 概念定义折扣回报:Ut=rt+γrt+1+γ2rt+2+...U_t=r_t+\gamma r_{t+1}+\gamma^2r_{t+2}+...Ut=rt+γrt+1+γ2rt+2+.
2022-04-11 00:08:38 1893
原创 强化学习—— Target Network & Double DQN(解决高估问题,overestimate)
强化学习—— Target Network & Double DQN(解决高估问题,overestimate)1TD算法2. 高估问题2.1 Maximization2.1.1 数学解释2.1.2 动作价值函数的高估2.2 Bootstrapping2.3 高估是否有害3. 高估的解决方案3.1 Target Network3.1.1 Target Network的结构3.1.2 学习方式3.2 Double DQN4. 总结1TD算法TD Target:yt=rt+maxaQ(st+1,a
2022-04-10 14:20:02 2263
原创 强化学习—— 经验回放(Experience Replay)
强化学习—— 经验回放(Experience Replay)1、DQN的缺点1.1 DQN1.2 DQN的不足1.2.1 经验浪费1.2.2 相关更新(correlated update)2 经验回放2.1 简介2.2 计算步骤2.3 经验回放的优点3. 改进的经验回放(Prioritized experience replay)3.1 基本思想3.2 重要性抽样(importance sampling)3.2.1 抽样方式3.2.2 学习率变换(scaling learning rate)3.2.3 训
2022-04-10 13:08:47 9388 1
原创 强化学习—— TD算法(Sarsa算法+Q-learning算法)
强化学习—— TD算法(Sarsa算法+Q-learning算法)1. Sarsa算法1.1 TD Target1.2 表格形式的Sarsa算法1.3 神经网络形式的Sarsa算法2. Q-learning算法2.1 TD Target2.2 表格形式的Q-learning算法2.3 神经网络形式的Q-learning算法(DQN)3. Saras和Q-learning的区别4. Multi-step TD Target4.1 Sarsa的Multi-step TD Target4.2 Q-learnin
2022-04-08 19:52:14 5646
原创 python——xpath
python——xpath1、xpath简介2. 安装3. 数据转换4. 调用xpath方法1、xpath简介xpath是语法不是解析库xpath语法:内容语法节点/跨节点//精确的标签//a[@属性=“属性值”]标签包裹的内容/ text()属性@href模糊匹配//div[contain(@class,“a”)]下一个节点(兄弟关系)即取兄弟标签//head/following-sibling:: *[1]注意事项
2022-04-07 13:48:37 1152
原创 python——正则表达式
python——正则表达式1、简介2、常用的元字符3、常用表达式举例4、运算符优先级5、常用正则表达式6、python 正则的简单使用6.1 贪婪模式与非贪婪模式6.2 转义字符的使用6.3 除了换行符之外的匹配(想匹配换行符需添加修饰符)6.4 纯数字的正则6.5 匹配判断的方法6.6 范围运算 [123] [1-9]6.7 正则的方法1、简介正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特
2022-04-07 13:29:48 987
原创 python —— 装饰器
python —— 装饰器1、装饰器简介2、简单装饰器3、带参数的装饰器3、类装饰器4、functools.wraps5、内置装饰器5.1 @classmethod5.2 @staticmethod5.3 @property6、属性的分类6.1 实例的属性6.2 类属性6.3 类属性1、装饰器简介1、函数也是一个对象,而且函数对象也可以被赋值给变量,所以通过变量也能调用该函数2、函数对象有一个__name__属性,可以拿到函数的名字3、装饰器的作用就是为已经存在的对象添加额外的功能4、装饰器是在
2022-04-07 12:57:12 909 1
原创 Letcode题解 —— 4. 寻找两个正序数组的中位数
Letcode题解 —— 4. 寻找两个正序数组的中位数1.题目2. 解题思路3. 参考代码1.题目题目链接给定两个大小分别为 m 和 n 的正序(从小到大)数组 nums1 和 nums2。请你找出并返回这两个正序数组的 中位数 。算法的时间复杂度应该为 O(log (m+n)) 。示例 1:输入:nums1 = [1,3], nums2 = [2]输出:2.00000解释:合并数组 = [1,2,3] ,中位数 2示例 2:输入:nums1 = [1,2], nums2 = [3
2022-04-07 12:33:40 624 1
原创 Tensorflow(六) —— Tensor如何进行数学运算
Tensorflow(六) —— 数学运算1 operation type1.1 element wise (元素级运算)1.2 matrix wise1.3 dim wise2 + - * / // %3 tf.math.log 、 tf.exp4 pow、sqrt5 @ 、 matmul1 operation type1.1 element wise (元素级运算)+ - * /1.2 matrix wise矩阵相乘并行计算,一次完成多个矩阵相乘[b,3,4]@[b,4,5]相当于
2022-04-06 13:17:40 500
原创 Tensorflow(五) —— Tensor的broadcast_to操作
Tensorflow(五) —— broadcast_to1 broadcast_to介绍1.1 key idea1.2how to understand1.3 why broadcasting1.4 broadcastable2 隐式3 显式4 tf.broadcast_to VS tf.tile1 broadcast_to介绍1.1 key ideainsert into 1 dim ahead if neededexpand dims with size 1 to same size即
2022-04-06 13:12:25 769
原创 Tensorflow(四) —— Tensor的维度变换
Tensorflow(四) —— 维度变换1 维度变化主要方式2 reshape3 reshape is flexible4 tf.transpose(转置)5 pytorch 和 tensorflow数据互通实例6 expand_dims 增加维度7 squeeze 删除某个位数为1的轴1 维度变化主要方式1、shape ndim2、reshape3、expand_dims squeeze4、transpose5、broadcast_to2 reshapea = tf.rando
2022-04-06 13:04:46 1545
原创 Tensorflow(三) —— Tensor的索引与切片
Tensorflow(三) —— 索引与切片1 主要的几种索引方式2 basic indexing3 numpy_style indexing4 start:end5 start:end:step6 ::-1 实现倒序功能7 ... 代表任意长8 selective indexing(可选索引)9 gather_nd索引10 tf.boolean_mask1 主要的几种索引方式1、basic indexing2、same with numpy3、gather4、gather_nd5、boo
2022-04-06 12:59:42 618
原创 Tensorflow(二) —— 创建Tensor类型的数据
Tensorflow(二) —— 创建Tensor1 创建Tensor的方式2 from numpy、list3 tf.zeros4 tf.zeros_like5 tf.ones 和 tf.ones_like6 Normal(正态分布)7 uniform(均匀分布)8 随机打散(random permutation)9 各种Tensor的典型应用1 创建Tensor的方式1、from numpy、list2、zeros、ones3、fill4、random5、constant6、Appl
2022-04-06 12:50:38 668
原创 Tensorflow(一) —— 数据类型
Tensorflow(一) —— 数据类型1 主要的数据类型2 Tensor的种类3 基本数据类型4 创建数据类型实例4.1 创建 int类型4.2 创建float类型4.3 类型使用不当4.4 创建布尔类型4.5 创建字符串类型5 Tensor常见属性5.1 device属性5.2 CPU和GPU转移5.3 Tensor转化为numpy:5.4 形状和维度5.5 判断一个对象是否为Tensor5.6 查看数据类型5.7 数据类型判断6 数据类型之间的相互转换6.1 numpy转tensorflow6.
2022-04-06 12:43:37 941
原创 数据挖掘 —— 模型评估
数据挖掘 —— 模型评估1.分类模型评估(一)1.1 二分类模型1.2 多分类模型1.3 代码2.分类模型评估(二)2.1 ROC 与 AUC2.2 代码1.分类模型评估(一)1.1 二分类模型一般情况下更关注正类混淆矩阵:TP(TruePositive):正确的正类FN(FalseNegative):错误的负类FP(FalseNegative):错误的正类TN(TrueNegative):正确的负类 TN FP FN TP
2022-04-06 10:00:57 1315
原创 数学理论—— 蒙特卡洛近似
数学理论—— 蒙特卡洛近似1. 圆周率估算1.1 理论1.2 数学模型2. 上限置信区间策略3. 蒙特卡洛树搜索3.1 选择3.2 扩展3.3 模拟3.4 反向传播3.5 流程图4. 代码实现1. 圆周率估算1.1 理论1.2 数学模型设有k个赌博机,选择第I个赌博机后,获得的回报为:VItV_{I_t}VIt经过n次操作后的悔值函数为(第一项为最大的奖赏):Qn=maxi=1,...,k∑t=1nVi,t−∑t=1nVIt,tQ_n=\displaystyle{max_{i=1,..
2022-04-06 09:59:53 2200
原创 数据挖掘 —— 半监督学习(标签传播算法)
数据挖掘 —— 半监督学习(标签传播算法)标签传播算法参数解释代码结果标签传播算法参数解释标签传播算法要求为标注数据标签为1LablePropagation(kernel,gamma,n_neighbors)kernel:{“knn”,“rbf”}gamma:rbf中的rn_neighbors:knn中的参数代码from sklearn.datasets import load_irisfrom sklearn.semi_supervised import LabelPropag
2022-04-05 16:35:57 1969 1
原创 数据挖掘 —— 无监督学习(关联)
数据挖掘 —— 无监督学习(关联)Apriori算法代码结果Apriori算法代码from itertools import combinationsdef comb(lst): ret=[] for i in range(1,len(lst)+1): ret+=list(combinations(lst,i)) return retclass AprLayer(object): d=dict() def __init__(self):
2022-04-05 16:31:31 613 1
原创 (数据挖掘 —— 无监督学习(聚类)
数据挖掘 —— 无监督学习(聚类)1. K-means1.1 生成指定形状的随机数据1.2 进行聚类1.3 结果2. 系统聚类2.1 代码2.2 结果3 DBSCAN3.1 参数选择3.2 代码3.3 结果1. K-meansK-Means为基于切割的聚类算法1.1 生成指定形状的随机数据import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeans
2022-04-05 16:26:20 1286 3
原创 数据挖掘 —— 有监督学习(回归)
数据挖掘 —— 有监督学习(回归)1. 线性回归模型1.1 线性回归模型1.2 岭回归模型1.3 Lasso回归模型2 逻辑回归模型3 回归树与提升树4 总结1. 线性回归模型1.1 线性回归模型from sklearn.linear_model import LinearRegressionLR_model = LinearRegression()LR_model.intercept_ :截距LR_model.coef_ :权重1.2 岭回归模型from sklearn.line
2022-04-05 16:17:11 896
原创 数据挖掘 —— 有监督学习(分类)
数据挖掘 —— 有监督学习(分类)1. KNN分类算法2. 决策树分类算法3. SVM算法简介4. 分类——集成算法4.1 随机森林参数介绍4.2 Adaboost算法参数介绍5 总结1. KNN分类算法预备知识:KD-Tree算法 (KDimensional Tree)在空间中寻找与目标点距离最近的k个点from sklearn.neighbors import NearestNeighborsn_neighbors 为查询的临近点个数algorithm 为查询算法‘ball_t
2022-04-05 16:02:21 1956 1
原创 数据挖掘 —— 探索性数据分析
数据挖掘 —— 探索性数据分析1. 统计检验1.1 正态性检验1.2 卡方检验1.3 独立分布t检验1.4 方差检验1.5 Q-Q图1.6 相关系数2 单因素分析2.1 线性回归2.2 PCA 奇异值分解2.3 主成分分析(PCA自定义实现)3 复合分析3.1 分组分析3.1.1 离散数据分组3.1.2 连续数据分组3.1.3 不纯度(GiNi系数)3.2 相关分析4 因子分析(成分分析)1. 统计检验1.1 正态性检验用于检验数据是否符合正态性分布# 生成正态分布的观测数据norm_data
2022-04-05 15:34:24 4327 1
原创 数据挖掘 —— 数据预处理
数据挖掘 —— 数据预处理1. 数据清洗2. 特征预处理2.1 特征选择2.2 特征变换3 特征降维1. 数据清洗数据清洗包括数据样本抽样和异常值(空值)处理直接丢弃(包括重复数据)把是否有异常当做一个新的属性,替代原值集中指代边界值指代插值import pandas as pdimport numpy as npdf = pd.DataFrame({ "A":['a0','a1','a1','a2','a3','a4'],
2022-04-05 15:11:52 2158
原创 python数据分析—— pandas
python数据分析—— pandas1.模块导入2. Series对象的创建和索引3 DataFrame的创建及相关属性4 DataFrame修改索引、添加数据及删除数据4.1 DataFrame修改index columns4.2 添加数据4.3 删除数据5 数据处理6 数据合并7 多层索引8 时间序列9 分组聚合10 读取、写入 Excel11 获取数据库中的数据1.模块导入import pandas as pdfrom pandas import Series,DataFrameimpor
2022-04-05 14:48:00 1868 1
原创 python科学计算—— numpy
python科学计算—— numpy1.模块导入2. 数组的基本属性和操作2.1 创建一维和二维数组2.2 常用属性2.3 调整数组的形状2.4 将数组转化为list2.5 numpy的数据类型2.6 保留小数位数2.7 数组的计算2.8 数组中的轴2.9 数组的索引和切片2.10 数组中数值的修改2.11 数组的删除、添加和去重3 numpy的计算4 numpy常用数学函数5 数组的拼接和分割6 数组中nan和inf7 二维数组的转置1.模块导入import numpy as np2. 数组的基
2022-04-05 14:10:32 1085 1
原创 python绘图—— matplotlib
python绘图—— matplotlib1.模块导入2.折线图绘制2.1 设置画布大小2.2画图2.3 设置显示中文2.4 设置标题2.5 设置图例2.6 设置坐标轴刻度和刻度标签2.7 设置坐标轴范围2.8 设置坐标轴标题2.9 改变坐标轴的默认显示方式2.10 图片保存2 散点图3 条形图4 直方图5 饼图6 一图多子图1.模块导入from matplotlib import pyplot as pltfrom matplotlib import font_managerimport num
2022-04-05 13:42:33 1448 1
原创 强化学习—— 蒙特卡洛树(Monte Carlo Tree Search, MCTS)
强化学习—— 蒙特卡洛树(Monte Carlo Tree Search, MCTS)1. 单一状态蒙特卡洛规划1.1 特点1.2 数学模型2. 上限置信区间策略3. 蒙特卡洛树搜索1. 单一状态蒙特卡洛规划以 多臂赌博机(multi-armed bandits) 为例1.1 特点为序列决策问题,在利用(exploitation)和探索(exploration)之间保持平衡,利用为过去决策中的最佳汇报,探索为未来获得更大回报。1.2 数学模型设有k个赌博机,选择第I个赌博机后,获得的回报为
2022-04-03 18:22:38 9853 1
原创 强化学习(五)—— AlphaGo与Alpha Zero
强化学习(五)—— AlphaGo与Alpha Zero1. AlphaGo1.1 论文链接1.2 输入编码(State)1.3 训练及评估流程1.4 模仿学习(Behavior Cloning)1.5 策略网络依据策略梯度进行学习1.6 价值网络训练1.7 Monte Carlo Tree Search1.7.1 Selection2.1 网络结构2. AlphaGo Zero2.1 论文链接1. AlphaGo1.1 论文链接查看原文1.2 输入编码(State)棋盘大小:[19,19]
2022-03-31 15:50:42 3677 1
原创 Latex常用公式编辑符号
Latex常用公式编辑符号1. 数学运算符2. 希腊字母3. 连接及标记符号3.1 箭头1. 数学运算符2. 希腊字母3. 连接及标记符号3.1 箭头符号Latex编码←\gets←\gets⟵\longleftarrow⟵\longleftarrow↚\nleftarrow↚\nleftarrow↔\leftrightarrow↔\leftrightarrow⇆\leftrightarrows⇆\leftrightarrows⟷\lon
2022-03-31 14:50:37 1250 2
原创 强化学习(四)—— Actor-Critic
强化学习(四)—— Actor-Critic1. 网络结构2. 网络结构2. 策略网络的更新-策略梯度3. 价值网络的更新-时序差分(TD)4. 网络训练流程3. 案例1. 网络结构状态价值函数:Vπ(st)=∑aQπ(st,a)⋅π(a∣st)V_\pi(s_t)=\sum_aQ_\pi(s_t,a)\cdot\pi(a|s_t)Vπ(st)=a∑Qπ(st,a)⋅π(a∣st)通过策略网络近似策略函数:π(a∣s)≈π(a∣s;θ)\pi(a|s)\approx\
2022-03-29 20:37:34 3227
自组织映射网络 ——python实现SOM(用于聚类)
2021-01-13
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)python实现代码
2020-12-21
windows installer clean up.zip
2020-09-10
python实现BP神经网络的代码
2020-05-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人