- 博客(6)
- 资源 (16)
- 收藏
- 关注
原创 python实现一个tenCrop的函数
虽然torchvision.transforms模块实现了"RandomResizedCrop", "RandomSizedCrop", "FiveCrop", "TenCrop"等函数,本文写下另一个实现,方便自己随便改写Tencrop的实现代码。如下所示:import numpy as npdef flow_stack_oversample(flow_stack, crop_d...
2019-01-22 16:31:41 980
原创 python 统计目录下文件匹配并计数
talk is cheap,show you the code:import fnmatchimport osdef count_files(directory, prefix_list): lst = os.listdir(directory) cnt_list = [len(fnmatch.filter(lst, '*'+x)) for x in prefix_li...
2019-01-22 15:54:05 948
原创 python 中list与array互相转换。
将array转成list比较简单,如下:#array to listimport numpy as np #array模块,但其只支持一维数组,不支持多维数组,也没有各种运算函数。#matrix=[0 for i in range(4)] #这样定义的数组时list object,可以拿list当数组用matrix_array=np.random.randint(0,3,(2,3)...
2019-01-22 15:12:56 96530 4
原创 HNSW算法原理(一)
原文链接:https://blog.csdn.net/CHIERYU/article/details/81989920HNSW算法可类比于skip lists数据结构,对于增和查操作,其与skip lists有很多相同之处,下面讲讲HNSW算法中的2个关键问题,即:如何确定待插入点的层次,如何调参。一、HSNW算法将样本插入到第几层每个样本属于哪个层呢?首先要写一个确定层次的...
2019-01-22 11:23:20 9569 4
原创 SMOTE插值代码阅读
类别不均衡学习的基本策略包括:1)对分类器的预测值缩放,改变阈值;2)对数据集里的反例进行欠采样;3)对正例进行过采样;欠采样由于丢弃了大量反例,减少了训练集大小,训练时间开销相比过采样要大;过采样法不能简单地对初始正例进行重复采样,这会导致过拟合;正确过采样的方法是对正例进行插值。SMOTE的主要步骤根据 机器学习 —— 类不平衡问题与SMOTE过采样算法 的介绍如下所示:SM...
2019-01-20 20:30:57 999
原创 如何判断随机变量是否服从正态分布
(分布检验问题)假设有n个随机数,检验这些随机数是否由高斯分布产生,方法如下:1. 计算n个随机变量的平均值u;2. 对n个随机变量排序,并计算相邻两个数的差dx;3. 对第2个数到第n个数,计算z[i]=(x[i]-u)/dx;4.求出max{z[i]},min{z[i]},将区间[min,max]划分n份,统计属于前i个区间的z[j]元素个数,即满足z[j]<=min+(...
2019-01-19 12:14:58 17112
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人