1.有一组基因芯片数据,样本的个数为 216, 其中肺癌 90 个,其余为正常人, 每个样本的基因芯片数据维度为 10500。 计划用 2/3 数据训练,剩下测试。
1)要求用
GA
算法实现从中选取
10 个与肺癌相关的关键的基因,编写 matlab 程序实现预测模型。
% 假设P是个矩阵,里面存放着216个维度为10500的基因芯片数据
PP=P(:,1:144); %训练集216×(2/3)
PT=P(:,145:216);%测试集216×(1/3)
TR=(PP);
TE=(PT);
%假设T1是TR的目标集
%假设T2是TE的目标集
options=gaoptimset('PopulationSize',50,'Generations',20,'PlotFcns',@gaplotbestf);%调用遗传算法工具箱,种群数50,迭代数20
spread=5;
FitnessFunction=@(x)fit_crab_features(x,TR,T1,TE,T2,spread);
n=10; %关键数据的值
LB=[1 ... 1]; %10个1
UB=[10500 ... 10500]; %10个10500
[x,fval]=ga(FitnessFunction,n,[],[],[],[],LB,UB,[],options);
有一组基因芯片数据,样本的个数为 216, 其中肺癌 90 个,其余为正常人, 每个样本的基因芯片数据维度为 10500。 计划用 2/3 数据训练,剩下测试。
2)1.设计
RBF 精确神经网络的预测模型, 标注隐含层的神经元的个数, 以及隐含层的权值是如何计算的, 以及采用的激活函数.。
2. 编写 matlab 简单程序实现预测模型。rbf+wavalet