![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 95
一个人旅行*-*
不想当医生的程序员不是个好厨子
展开
-
SIAMCAT的R实现
SIAMCAT: Statistical Inference of Associations between Microbial Communities And host phenoTypesKonrad Zych, Jakob Wirbel, and Georg Zeller1*1EMBL Heidelberg*georg.zeller@embl.deDate last modified: 2020-04-04Contents1About This Vignette 2Int..翻译 2021-08-20 21:03:02 · 983 阅读 · 1 评论 -
机器学习的R实现(mlr包)
https://www.analyticsvidhya.com/blog/2016/08/practicing-machine-learning-techniques-in-r-with-mlr-package/Table of ContentGetting Data Exploring Data Missing Value Imputation Feature Engineering Outlier Removal by Capping New Features Machine翻译 2021-08-20 15:38:23 · 2851 阅读 · 0 评论 -
Jupyter Notebook简介、安装及使用教程
一、什么是Jupyter Notebook?1. 简介Jupyter Notebook是基于网页的用于交互计算的应用程序。其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。——Jupyter Notebook官方介绍简而言之,Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。2. 组成部分① 网页应用网页应用即转载 2020-11-19 14:15:06 · 788 阅读 · 0 评论 -
ConsensusClustering及R实现
一、定义及K值选择一致性聚类通过改变聚类的数据集(里面的数据全部从原始数据中抽取,也可以理解为是原始数据的子集),通过考量任意一个数据在不同样本中聚类表现的一致性来确定聚类的参数是否合适。第一步:从原始数据中随机抽取子集,当然子集的规模不能太小,最好是原始数据集的半数以上(这是我自己理解的,数据太少聚类的话没有意义),子集要尽量多,以确保里面的每一个数据都多次被取到(100次以上),然后,我们选择任意一种聚类方法,可以使K-means或者层次聚类,对所有的数据子集分别聚类。...原创 2020-07-23 22:12:22 · 12830 阅读 · 1 评论 -
机器学习中的目标函数、损失函数、代价函数的区别
转载自:https://www.zhihu.com/question/52398145基本概念:损失函数:计算的是一个样本的误差代价函数:是整个训练集上所有样本误差的平均目标函数:代价函数 + 正则化项实际应用:损失函数和代价函数是同一个东西,目标函数是一个与他们相关但更广的概念,举例说明:上面三个图的曲线函数依次为f1(x),f2(x),f3(x),我们想用这三个函数分别来拟合真实值Y。我们给定x,这三个函数都会输出一个f(X),这个输出的f(X)与真实值Y可能是相同的转载 2020-06-15 15:20:37 · 368 阅读 · 0 评论 -
bagging与boosting原理详解
为了更好地对数据进行预测,通常要用到模型融合,模型融合算法成功的关键在于能保证弱分类器的多样性(diversity)。融合不稳定的学习算法能得到更明显的性能提升。最基本的模型融合方式有voting和averaging。Voting为投票法,是针对分类问题;Averaging是平均法,针对回归问题。模型融合方法有bagging和boosting1.Bagging通过K次的有放回抽样,训练K个子模型(每次随机抽样训练1个模型) 对K个模型结果进行Voting/Average融合2..原创 2020-06-19 10:14:47 · 2098 阅读 · 0 评论