![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 74
机器学习相关
计算之道
计算生物学
展开
-
白箱模型、黑箱模型和灰箱模型
主要区别在于模型的透明度、可解释性和预测性能之间的权衡。白箱模型最易解释,但可能在复杂任务上的预测能力受限;黑箱模型预测能力强,但缺乏透明度;灰箱模型则尝试在这两者之间取得平衡。实际应用中,选择哪种类型的模型取决于具体任务的需求、监管要求以及对模型可解释性的重视程度。原创 2024-06-13 14:54:41 · 377 阅读 · 0 评论 -
数据标准化问题
和有什么区别,哪个是正确的??回答:两个代码段的主要区别在于是否正确地使用了fit和transform。原创 2024-05-30 14:18:22 · 288 阅读 · 0 评论 -
Feature engineering-MANOVA分析+Boxplots
target_column = 'target_value' # 替换为你的实际列名。target_column = df.columns[-1] # 替换为你的实际列名。# 假设最后一列是因变量的数值列,这里用'target_value'作为示例列名。# 如果不知道列名,可以使用 df.columns[-1] 来获取最后一列的列名。# 提取特征数据(除了因变量的数值列和转换后的类别列)# 将最后一列的数值转换为类别(0或1)# 设置箱型的填充颜色。# 设置中位数线的颜色。# 设置均值线的颜色。原创 2024-05-15 15:36:13 · 375 阅读 · 0 评论 -
ML learning
完结撒花-感谢安德鲁原创 2024-04-12 09:38:11 · 167 阅读 · 0 评论 -
查看Scikit-Learn 中都有哪些监督学习模型
上述代码通过 all_estimators 函数获取所有的分类器和回归器,并打印它们的名称。type_filter 参数用于指定筛选类型,可以选择 'classifier' 或 'regressor'。注意,Scikit-Learn 版本更新可能会导致一些模型的名称变化或新增模型,因此建议在使用时查看官方文档以获取最新信息。# 获取所有 Scikit-Learn 模型的列表。# 打印所有模型的名称。原创 2024-02-29 16:15:26 · 376 阅读 · 0 评论 -
#特征工程
相比之下,Boruta算法是一种用于特征选择的方法,它基于随机森林的特征重要性来判断哪些特征是显著的,哪些是次要的。通过结合方差阈值、特征相关性分析、单因素统计测试、递归特征消除和特征重要性等特征选择方案,在减少特征数量的同时,最大限度地保留对目标变量的关键信息,从而提升模型的效率、可解释性,并防止过度拟合的发生。Boruta算法的主要优势在于它能够在考虑随机森林特征重要性的同时,引入阴影特征进行比较,从而更全面地评估特征的显著性。随机森林的特征重要性评估通常使用的是随机森林本身提供的特征重要性方法。原创 2024-01-08 14:08:15 · 1314 阅读 · 0 评论 -
数据预处理——特征缩放
算法,如果我们有两个特征,特征 A 的取值范围在 [1,10],特征 B 的取值范围在 [1, 100000]。注意,在预测新数据时,一定要使用相同的缩放器对象来进行缩放,以确保应用相同的缩放规则。在这里,你需要使用之前拟合好的缩放器来对新数据进行缩放,以保持相同的缩放规则。根据数据的分布和机器学习模型的需求,选择合适的缩放方法,例如标准化(Standardization)或归一化(Normalization)。使用拟合好的缩放器对训练数据进行缩放,将数据转换为经过标准化或归一化的形式。原创 2024-01-03 11:08:42 · 1486 阅读 · 0 评论 -
alphafold2在本地计算平台的部署【禁止转载】
Alphafold2有docker和conda两种安装方式,提供的是docker版本的安装教程,conda版是民间修改版。怀着不信民间”歪门邪道“的想法,我原本更倾向于按照官方提供的流程进行部署,然而最后没有成功。安装失败的很重要的一个原因是alphafold2本地部署的相关教程和讨论太少了,当然这也和它本身对硬件的要求有关系:一般的个人电脑完全带不起来。原创 2023-12-19 13:45:36 · 2175 阅读 · 10 评论 -
机器学习-深度学习概念总结
机器学习这个词是让人疑惑的,首先它是英文名称Machine Learning(简称ML)的直译,在计算界Machine一般指计算机。这个名字使用了拟人的手法,说明了这门技术是让机器“学习”的技术。但是计算机是死的,怎么可能像人类一样“学习”呢?传统上如果我们想让计算机工作,我们给它一串指令,然后它遵照这个指令一步步执行下去。有因有果,非常明确。但这样的方式在机器学习中行不通。机器学习根本不接受你输入的指令,相反,它接受你输入的数据!转载 2023-12-14 11:16:49 · 49 阅读 · 0 评论 -
机器学习-小样本情况下如何机器学习
交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。首先,我们随机的将样本数据分为两部分(比如:70%的训练集,30%的测试集),然后用训练集来训练模型,在测试集上验证模型及参数。第三种是 留一交叉验证(Leave-one-out Cross Validation),它是第二种情况的特例,此时S等于样本数N,这样对于N个样本,每次选择N-1个样本来训练数据,留一个样本来验证模型预测的好坏。否则就用S折交叉验证。转载 2023-11-16 10:37:16 · 365 阅读 · 0 评论