生物信息
_Mm_
这个作者很懒,什么都没留下…
展开
-
plink把ped、map转换成bed、bim、fam二进制文件时发生的错误
ped中的ATCG必须是双等位且与map中的行数相等,例如map中有10行,则ped中必须有10对ATCG.原创 2022-10-05 15:28:15 · 1070 阅读 · 0 评论 -
过采样 Oversampling
过采样是指对训练集里的某类样例增加采样次数以减小 类别不平衡 。与之相对应的是 欠采样 ,是指对训练集里的某类样例减少采样次数。过采样和欠采样的对比过采样会随机复制少数样例以增大它们的规模。欠采样则随机地少采样主要的类。过采样的好处是它也会复制误差的数量。相对地,欠采样会让独立变量的方差看起来比其实际的方差更高。过采样和类别不平衡类别不平衡(class-imbalance)是指在训练 分类器 中所使用的训练集的类别分布不均。比如说一个 二分类 问题, 1000 个训练样本,比较理想的原创 2022-04-27 15:33:22 · 1209 阅读 · 0 评论