书籍:python机器学习集合Cookbook Ensemble Machine Learning Cookbook - 2019 ...

简介

图片.png

使用Keras,H2O,Scikit-Learn,Pandas等实现机器学习算法来构建集合模型

主要特点

  • 使用基于配方的方法应用流行的机器学习算法
  • 实施增强,装袋和堆叠集合方法以改进机器学习模型
  • 发现真实世界的合奏应用,并在Kaggle比赛中遇到复杂的挑战

集合建模是一种用于提高机器学习模型性能的方法。它结合了两个或多个相似或不同的机器学习算法,以提供卓越的智力。本书将帮助您实现流行的机器学习算法,以涵盖不同的集成机器学习范例,如增强,装袋和堆叠。

Ensemble Machine Learning Cookbook将首先让您熟悉集成技术和探索性数据分析的基础知识。然后,您将学习如何实现与统计和机器学习算法相关的任务,以了解多个异构算法的集合。它还将确保您不会错过关键主题,例如重新采样方法。随着您的进步,您将更好地了解套袋,增强,堆叠以及使用真实世界示例使用随机森林算法。本书将重点介绍这些集合方法如何使用多个模型来改善机器学习结果,与单个模型相比。在最后的章节中,您将深入研究使用神经网络,自然语言处理等的高级集成模型。您还可以实施欺诈检测,文本分类和情绪分析等模型。

在本书的最后,您将能够利用集成技术和机器学习算法的工作机制,使用单独的配方构建智能模型。

你会学到什么

  • 了解如何将机器学习算法用于回归和分类问题
  • 实施集成技术,例如平均,加权平均和最大投票
  • 掌握先进的整体方法,例如自举,装袋和堆叠
  • 使用随机森林进行分类和回归等任务
  • 实现同构和异构机器学习算法的集合
  • 学习并实施各种提升技术,例如AdaBoost,Gradient Boosting Machine和XGBoost

这本书的目的是谁

本书专为数据科学家,机器学习开发人员和深度学习爱好者而设计,他们希望深入研究机器学习算法,以构建强大的集成模型。 Python编程和基本统计​​的工作知识是帮助您掌握本书概念的必要条件。

参考资料

图片.png
图片.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Big data has become a popular buzzword across many industries. An increasing number of people have been exposed to the term and are looking at how to leverage big data in their own businesses, to improve sales and profitability. However, collecting, aggregating, and visualizing data is just one part of the equation. Being able to extract useful information from data is another task, and much more challenging. Traditionally, most researchers perform statistical analysis using historical samples of data. The main downside of this process is that conclusions drawn from statistical analysis are limited. In fact, researchers usually struggle to uncover hidden patterns and unknown correlations from target data. Aside from applying statistical analysis, machine learning has emerged as an alternative. This process yields a more accurate predictive model with the data inserted into a learning algorithm. Through machine learning, the analysis of business operations and processes is not limited to human-scale thinking. Machine-scale analysis enables businesses to discover hidden value in big data. The most widely used tool for machine learning and data analysis is the R language. In addition to being the most popular language used by data scientists, R is open source and is free for use for all users. The R programming language offers a variety of learning packages and visualization functions, which enable users to analyze data on the fly. Any user can easily perform machine learning with R on their dataset without knowing every detail of the mathematical models behind the analysis.

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值