机器学习
super尚
热爱学习的一枚研究僧
展开
-
深度学习中使用稀疏矩阵
目的单机环境下,如果特征较为稀疏且矩阵较大,那么就会出现内存问题,如果不上分布式 + 不用Mars/Dask/CuPy等工具,那么稀疏矩阵就是一条比较容易实现的路。SciPy 中有 7 种存储稀疏矩阵的数据结构:bsr_matrix: Block Sparse Row matrix 块状稀疏行矩阵coo_matrix: COOrdinate format matrix 矩阵格式的COOrdinatecsc_matrix: Compressed Sparse Column matrix 压缩的稀疏列原创 2022-04-09 10:55:54 · 845 阅读 · 0 评论 -
神经网络之Dropout解析
在机器学习的模型中,如果模型的参数太多,而训练样本又太少,训练出来的模型很容易产生过拟合的现象。过拟合具体表现在:模型在训练数据上损失函数较小,预测准确率较高;但是在测试数据上损失函数比较大,预测准确率较低。Dropout说的简单一点就是:我们在前向传播的时候,让某个神经元的激活值以一定的概率p停止工作,这样可以使模型泛化性更强,因为它不会太依赖某些局部的特征,如图1所示。Dropout具体工作流程(1)首先随机(临时)删掉网络中一半的隐藏神经元,输入输出神经元保持不变(图3中虚线为部分临时原创 2022-04-09 10:54:36 · 1042 阅读 · 0 评论 -
TF报错:Use tf.where in 2.0, which has the same broadcast rule as np.where
TF报错:Use tf.where in 2.0, which has the same broadcast rule as np.where解决:原来是1.14.0,换成安装tf1.15.0原创 2022-01-24 15:57:32 · 2383 阅读 · 2 评论 -
conda查看当前系统中的python环境
打开Anaconda Prompt,输入conda env list,可以看到自己有几个环境,如下图所示:*所在位置即为当前环境在Anaconda Pronmpt中输入conda activate xxx,就会将xxx环境激活,随后输入conda install jupyter就能顺利安装jupyter notebook(xxx)ranh...原创 2021-12-01 12:59:24 · 21311 阅读 · 0 评论 -
机器学习——“决策树&随机森林”学习笔记
决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。决策树算法的核心是要解决两个问题:1)如何从数据表中找出最佳节点和最佳分枝?2)如何让决策树停止生长,防止过拟合?决策树的步骤:1.实例化2.训练模型3.导入测试集进行测试clf = DecisionTreeClassifier()clf = clf.fit(Xtrain,Ytrain)score_c = clf原创 2021-05-20 22:25:11 · 574 阅读 · 0 评论 -
读 A dual CNN–RNN for multiple people tracking
什么是多目标跟踪多目标追踪(MOT, multi-object tracking) 是指输入一段视频,在没有任何对目标的先验知识(外形或数量)的前提下,追踪其中一类或多类物体的运动轨迹。比如常见的行人追踪,车辆追踪。什么是检测前跟踪(TBD)一句话概括:检测前跟踪就是用多帧数据积累某些东西的方式来提高回波的信噪比。例如用标准霍夫变换来积累能量——SHT-TBD,用动态滤波来积累最优值——DP-TBD,等等。深度学习算法已经证明了它在图像和视频内容表示方面的显著改进。这些算法提供了丰富的特征表示,比人原创 2020-12-08 13:17:19 · 311 阅读 · 0 评论 -
百度API实现人流量数量检测(动态)
百度的这个API还挺好用的,对与不追求高精度的人来说非常适用,结合他官方给的文档,极易上手。需要做的就是通过API Key和Secret Key获取的access_token。然后稍微修改下代码就行,但是他给的代码并没有直接从摄像头获取视频,而是读取一个文件夹,那么就需要自己先对摄像头的输出视频进行处理。识别结果如下,"person_num"是当前画面的人数,in是累计进入的人数,out是累计走出去的人数。他这个有个缺点就是返回值里边并没有实时返回in和out的值,而是都是0,但是这个图片上有,图片原创 2020-11-22 19:32:33 · 2773 阅读 · 1 评论 -
sklearn——随机森林RandomForestClassifier的参数含义
n_estimators:森林中决策树的数量。默认100criterion:分裂节点所用的标准,可选“gini”, “entropy”,默认“gini”。max_depth:树的最大深度。如果为None,则将节点展开,直到所有叶子都是纯净的(只有一个类),或者直到所有叶子都包含少于min_samples_split个样本。默认是None。min_samples_split:拆分内部节点所需的最少样本数:如果为int,则将min_samples_split视为最小值。如果为float,则min_samp原创 2020-11-07 16:48:29 · 28617 阅读 · 0 评论 -
graphviz输出PDF报错b‘Format: “pdf“ not recognized. Use one of:\r\n‘]
win10 python3 graphviz输出不了PDF图片问题。已安装graphviz,win10环境变量也配置了,但还是报这个错误。废话不说,直接使用如下几步我成功了!打开cmd运行:dot -v运行:dot -c运行:dot -v,如果出现下图,那么就成了最后用.view就能输出了graph = graphviz.Source(dot_data)graph.view()结果如下图:...原创 2020-10-31 15:52:26 · 2751 阅读 · 9 评论 -
unsupported operand type(s) for +: ‘range‘ and ‘list‘
TypeError: unsupported operand type(s) for +: 'range' and 'list'在将range和list相加时会出现以上错误,只需强制将range转换为list类型即可,如下:columns = range(20) + ["class"]#错误columns = list(range(20)) + ["class"]#正确...原创 2020-10-30 17:20:17 · 2141 阅读 · 0 评论