python：scikit-learn（1），基本概念

最新推荐文章于 2024-06-29 10:44:40 发布

genome_denovo

最新推荐文章于 2024-06-29 10:44:40 发布

阅读量364

点赞数 1

分类专栏： scikit-learn python 文章标签： python scikit-learn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/genome_denovo/article/details/103499724

版权

《scikit-learn机器学习第2版》

第1章机器学习基础

机器学习：通过经验学习知道未来决策
机器学习分为监督学习和无监督学习

监督学习：分类类别已知
机器学习的输入称为解释变量，输出称为响应变量
组成监督学习经验的实例集合称为训练集，衡量程序性能的实例集合称为测试集
常见的监督机器学习有分类和回归
分类的响应变量为离散值，回归的响应变量为连续值
降维：发现对响应变量变化影响最大的特征过程
测试集：用于使用一些衡量标准来评估模型性能
注：选用测试集的策略，不把训练集中的观测值包含在测试集中，如果包含则很难估计算法是真的从训练集中学习到了泛化能力，还是只是简单的记住了训练例子。
过拟合：模型记住了训练数据的程序可预测训练集但无法预测新的例子，那模型对训练集产生记忆称为过拟合。
正则化：应用于模型中减少过拟合
验证集：用来微调被称为超参数的变量，超参数用于控制算法如何从训练数据中学习
所有用于机器学习的数据集中，训练集占50% - 70

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python：scikit-learn（1），基本概念

《scikit-learn机器学习第2版》第1章机器学习基础机器学习：通过经验学习知道未来决策机器学习分为监督学习和无监督学习监督学习：分类类别已知机器学习的输入称为解释变量，输出称为响应变量组成监督学习经验的实例集合称为训练集，衡量程序性能的实例集合称为测试集常见的监督机器学习有分类和回归分类的响应变量为离散值，回归的响应变量为连续值降维：发现对响应变量变化影响最大的特征过...
复制链接

扫一扫

专栏目录

genome_denovo CSDN认证博客专家 CSDN认证企业博客

码龄7年

73: 原创

9万+: 周排名

109万+: 总排名

34万+: 访问

: 等级

2463: 积分

285: 粉丝

153: 获赞

29: 评论

656: 收藏

私信

关注

热门文章

分类专栏

最新评论

生信：1：vcf格式文件解读
沉香GG: 你好，请问使用bcftools进行snp calling后的vcf文件中缺少AD（测序深度）信息是怎么回事？
生信：1：vcf格式文件解读
genome_denovo: 之前分析的经验，没有具体出处
生信：1：vcf格式文件解读
Li故乡: 您好，请问您推荐的：保留ReadPosRankSum>-1.65~-3.0的variant位点等相关推荐有文献出处吗？
生信：2：sam格式文件解读
genome_denovo: int是取整，&表示位运算；113 = 1＋16 + 32 + 64表示PAIRED,REVERSE,MREVERSE,READ1；数字的意义可以参考：https://broadinstitute.github.io/picard/explain-flags.html 输入flag值可以得到对应的意义。
生信：1：vcf格式文件解读
genome_denovo: 人全基因组大约3G，突变位点会非常多，14.6MB大小的文件不奇怪，你可以统计一下vcf文件突变的行数，非常多。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。