生物大分子平台(2)
2021SC@SDUSC
1、本周工作
阅读部分机器学习和深度学习源代码并且进行分析
2、部分代码分析
2.1 PCA
- 通常我们可以获得一维或者二维数据的直观图形,但是实际中很多的数据远比这些维数多,在使用机器学习和深度学习算法时,如果不对数据维数进行降低操作,将会引发灾难性后果。
- 实验所使用的数据集合为二维*10的随机样本与secom数据库,我们可以自己构造这个算法,也可以使用sklearn中自带的API来调用这个算法完成我们对数据的降维。
from sklearn.decomposition import PCA
pca = PCA() # n_components参数选择降维程度
pca = pca.fit(replaceNanWithMean()) # fit_transform()为转换数据
main_var = pca.explained_variance_ # 特征值
2.2 PyTorch
2.2.1 ImageTypeTest
- 定义转换器、池化层、线性隐藏层,构建好网络。
- 构建输入转换器与输出层的对应关系
- 调参完成训练
- 输出结果,完成结果可视化
2.2.2 NNTest
- 官方给出的实例
- 通过网络可以得到训练的结果
2.3 keras
- Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。Keras 的开发重点是支持快速的实验。能够以最小的时延把你的想法转换为实验结果,是做好研究的关键。
- 允许简单而快速的原型设计(由于用户友好,高度模块化,可扩展性)。同时支持卷积神经网络和循环神经网络,以及两者的组合。在 CPU 和 GPU 上无缝运行。
- keras具有的指导原则:用户友好、模块化、易扩展性、基于python实现等
- 使用keras可以让我们更方便的完成神经网络的构建。
3、引用资料
- https://keras.io/zh/#keras-python
- https://pytorch.org/
- https://blog.csdn.net/qq_36523839/article/details/82286805?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522163344251316780265472800%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=163344251316780265472800&biz_id=0&spm=1018.2226.3001.4187