• 高维数据源的问题已解决,是关于病患和正常人基因表达的数据,源数据已tag,只要
比较降维后数据分类的准确程度即可。
• 通过R实现了生成随机投影矩阵的方法RPGenerate(),包括高斯随机矩阵以及稀疏随
机矩阵,其中,稀疏随机矩阵的生成是按照一定概率将不同值投到矩阵中。
• 网上找到关于RandomProjection的python第三方库scikit-learn,目前在看它的源
码,思考如何利用R来实现其它步骤。
• 目前在想通过统计检验的方法如何找出原始数据中基因相关性,方便分类实现,即越
是不相关则分类效果越显著。
• 开始着手翻译找好的英文文献了,一天翻译一段左右。
• 统计学的知识基础还是不好,还需要多学习一下。
by gormit
01/14/2016
比较降维后数据分类的准确程度即可。
• 通过R实现了生成随机投影矩阵的方法RPGenerate(),包括高斯随机矩阵以及稀疏随
机矩阵,其中,稀疏随机矩阵的生成是按照一定概率将不同值投到矩阵中。
• 网上找到关于RandomProjection的python第三方库scikit-learn,目前在看它的源
码,思考如何利用R来实现其它步骤。
• 目前在想通过统计检验的方法如何找出原始数据中基因相关性,方便分类实现,即越
是不相关则分类效果越显著。
• 开始着手翻译找好的英文文献了,一天翻译一段左右。
• 统计学的知识基础还是不好,还需要多学习一下。
by gormit
01/14/2016