- 博客(7)
- 收藏
- 关注
原创 机器学习课程笔记
挑战问题: 1、泛化能力 SVM、集成学习泛化能力比较强 更准:大数据、模型 2、速度 训练速度快的往往测试速度慢:KNN 测试速度快的往往训练速度慢:神经网络 3、可理解性 黑盒子 4、数据利用能力 未标记数据、劣质数据 5、代价敏感 假阳性、假阴性问题 样本空间 (属性取值 - 1)…(属性取值 - 1) + ...
2018-05-15 08:18:18 248
原创 R语言机器学习
KNN library(class) knn(train, test, cl, k = 1, l = 0, prob = FALSE, use.all = TRUE) Tree-Structure library(C50) C5.0(train, class, trials = 1, costs = NULL) predict(m, test, type = “class”) Reg
2018-01-22 10:35:03 370
原创 SNP分析软件
BEAM 安装 将压缩包所有文件解压到一个文件夹中,尤其包括libgsl.dll和libslcblas.dll这两个文件,当然也包括data.txt文件 文件输入格式 由第二行开始,每一行包括每个个体的基因型数据,用markers表示,用空格间隔开 第一行代表患病状态,需要对应每一行数据 如果需要加入SNP的ID和位置信息,参数设置parapmeter.txt文件中需设置INC_SNP_
2017-11-28 11:32:22 6833
原创 Python
参与除法的两个数中有一个是浮点数,运算结果就是浮点数 专门用于整除的操作符——双斜线 // 幂运算符 ** 长整数末尾加上L 虚数均以 j ( J ) 结尾 import math math.floor() from math import sqrt sqrt() 注释符 #字符串 单引号和双引号没有区别 raw_imput 和 imput 函数,一般使用前者 长字符串使用
2017-11-09 11:32:28 180
原创 GAMETES数据模拟软件
User GuideModel Generation 可以生成特定的两位点模型(heritability 0.2, MAF 0.2) 可以设定的参数有:number of attributes, heritability, MAF, population prevalence, the name of SNP, the model difficulty metric used to identif
2017-10-24 10:31:35 1084
原创 Comparative analysis of methods for detecting interacting loci
比较了MDR、FIM、IG、BEAM、SH、MECPM、LRIT、LR 这8种方法,在本次实验中,表现最好的是MECPM方法。 全面搜索:IG、LRIT、LR 随机搜索:BEAM、MDR 确定性启发式搜索:SH、FIM、MECPMMDR(多因素降维) 如果cases数目和controls数目的比率超过一定的范围,则标记该基因型为“high-risk”。将high-risk基因型分为一组,lo
2017-10-18 16:16:55 266
原创 epiACO - a method for identifying epistasis based on ant Colony optimization algorithm
epiACO相较于普通的蚁群算法加入了适应性函数Svalue,路径选择策略以及路径记忆性策略。其中的Svalue结合了互信息和贝叶斯网络的优点,路径选择策略分为概率路径选择策略和随机路径选择策略,路径记忆性策略顾名思义,就是指会保留上一次迭代的备选路径,并且和本次迭代结果进行比较。 本论文将epiACO算法和epiMODE, TEAM, BOOST, SNPRuler, AntEpiseeker
2017-10-18 10:43:55 345
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人