2019年01月_悟道修炼中

10月 06月 02月 01月

原创 python实现一个tenCrop的函数

虽然torchvision.transforms模块实现了"RandomResizedCrop", "RandomSizedCrop", "FiveCrop", "TenCrop"等函数，本文写下另一个实现，方便自己随便改写Tencrop的实现代码。如下所示：import numpy as npdef flow_stack_oversample(flow_stack, crop_d...

2019-01-22 16:31:41 980

原创 python 统计目录下文件匹配并计数

talk is cheap，show you the code：import fnmatchimport osdef count_files(directory, prefix_list): lst = os.listdir(directory) cnt_list = [len(fnmatch.filter(lst, '*'+x)) for x in prefix_li...

2019-01-22 15:54:05 948

原创 python 中list与array互相转换。

将array转成list比较简单，如下：#array to listimport numpy as np #array模块，但其只支持一维数组，不支持多维数组，也没有各种运算函数。#matrix=[0 for i in range(4)] #这样定义的数组时list object,可以拿list当数组用matrix_array=np.random.randint(0,3,(2,3)...

2019-01-22 15:12:56 96530 4

原创 HNSW算法原理（一）

原文链接：https://blog.csdn.net/CHIERYU/article/details/81989920HNSW算法可类比于skip lists数据结构，对于增和查操作，其与skip lists有很多相同之处，下面讲讲HNSW算法中的2个关键问题，即：如何确定待插入点的层次，如何调参。一、HSNW算法将样本插入到第几层每个样本属于哪个层呢？首先要写一个确定层次的...

2019-01-22 11:23:20 9569 4

原创 SMOTE插值代码阅读

类别不均衡学习的基本策略包括：1）对分类器的预测值缩放，改变阈值；2）对数据集里的反例进行欠采样；3）对正例进行过采样；欠采样由于丢弃了大量反例，减少了训练集大小，训练时间开销相比过采样要大；过采样法不能简单地对初始正例进行重复采样，这会导致过拟合；正确过采样的方法是对正例进行插值。SMOTE的主要步骤根据机器学习 —— 类不平衡问题与SMOTE过采样算法的介绍如下所示：SM...

2019-01-20 20:30:57 999

原创如何判断随机变量是否服从正态分布

（分布检验问题）假设有n个随机数，检验这些随机数是否由高斯分布产生，方法如下：1. 计算n个随机变量的平均值u；2. 对n个随机变量排序，并计算相邻两个数的差dx；3. 对第2个数到第n个数，计算z[i]=（x[i]-u)/dx;4.求出max{z[i]},min{z[i]},将区间[min,max]划分n份，统计属于前i个区间的z[j]元素个数，即满足z[j]<=min+(...

2019-01-19 12:14:58 17112