《50篇》机器学习之Python开源教程
文章平均质量分 96
【算法原理+代码实例可做科研和毕设】详解机器学习的理论知识和底层原理
;剖析并解读机器学习的算法和实际应用
;构建实际案例进行进行机器学习的运用
;提供更多的实操数据项目进行演示
;将机器学习应用到实际的生活当中来
;监督学习,非监督学习,集成学习,图像处理,文本挖掘.......
优惠券已抵扣
余额抵扣
还需支付
¥19.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
王小王-123
【私信必回】CSDN博客专家、内邀精英签约作者,CSDN年度优秀创作者,华为云享专家,阿里云专家博主、腾讯云、简书、InfoQ、51CTO等开源社区创作者。左手诗情画意,右手代码人生,欢迎一起探讨技术的诗情画意!
展开
-
【总目录】机器学习原理剖析、开源实战项目、全套学习指南(50篇合集)
相信不管此时的你是怀着好奇心打开这篇文章;还是偶然间刷到这篇博文;或者带有学习目的性走到这片领域,我都相信,面前的你一定会成功,因为你懂得投资和学习。学习是一个不断发展的过程,我们要用联系的眼光看待事物,也要用发展的眼光考虑未来,更要有适度的投资建设自己。不是每一次的遇见都是那么的巧合,也不是每一次的邂逅都会成就一段美好,所以你要相信,你和这篇文章的遇见也是更高层次的探索。机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战1、机器学习之Python开源教程——专栏介绍及理论知识概述。.原创 2022-08-24 00:01:39 · 3838 阅读 · 28 评论 -
【自然语言实战】机器学习之基于评论内容的主题分类模型
朴素贝叶斯法通过训练数据集学习到联合概率分布P(X, Y),为得到联合概率分布,需得知先验概率分布以及条件概率分布,而条件概率分布具有指数级数量的参数,如果全部统计估计是不具有实际可行性的,所以朴素贝叶斯法对条件概率分布作了条件独立性的假设,这样会损失信息,牺牲分类准确性,但是让实际的操作具有了可操作性。:全称是Term Frequency,即词频(单词出现的频率),也就是一个单词在文档中出现的次数,次数越多越重要。单词的TF-IDF 值可以描述一个单词对文档的重要性,TF-IDF 值越大,则越重要。原创 2022-08-24 00:20:16 · 1413 阅读 · 2 评论 -
【项目实战】机器学习基于物品的旅游产品推荐系统
的基本思想是如果用户A喜欢物品a,用户B喜欢物品a、b、c,用户C喜欢a和c,那么认为用户A与用户B和C相似,因为他们都喜欢a,而喜欢a的用户同时也喜欢c,所以把c推荐给用户A。这些都已经成为游客出行考虑的问题,前期做大量的旅游攻略,不仅浪费时间,而且容易造成审美疲劳,导致厌倦,最终造成消费不佳,消费动力不足,间接地影响到国民旅游的良性发展。一个大型的电子商务推荐系统一般有非常多的物品,用户可能买的其中不到1%的物品,不同用户之间买的物品重叠性较低,导致算法无法找到一个用户的邻居,即偏好相似的用户。原创 2022-08-24 00:19:55 · 877 阅读 · 0 评论 -
【进阶版】 机器学习之强化学习、蒙特卡罗、AlphaGo原理浅析(22)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-24 00:19:47 · 759 阅读 · 0 评论 -
【进阶版】 机器学习之隐马尔可夫模型、条件随机场、LDA话题模型(21)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-24 00:19:39 · 721 阅读 · 0 评论 -
【进阶版】 机器学习之半监督学习、半监督聚类、规则学习相关原理知识(20)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-24 00:19:30 · 641 阅读 · 0 评论 -
【进阶版】 机器学习之计算学习、PAC学习、VC维相关原理知识(19)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-24 00:19:23 · 738 阅读 · 0 评论 -
【进阶版】 机器学习之稀疏学习、特征选择、过滤式选择、包裹式选择、正则化等(18)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-24 00:18:59 · 654 阅读 · 0 评论 -
【进阶版】 机器学习之各类距离度量概念:欧氏距离、马氏距离......(17)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-23 22:00:00 · 758 阅读 · 0 评论 -
【进阶版】 机器学习之主成分分析(PCA)、MDS算法、核化线性降维 (16)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-23 19:30:00 · 1189 阅读 · 3 评论 -
【进阶版】 机器学习之K均值聚类、层次聚类、密度聚类、实战项目含代码(15)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-23 18:00:00 · 1520 阅读 · 0 评论 -
【进阶版】 机器学习之聚类算法原理详解+案例解说(14)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-23 16:00:00 · 868 阅读 · 0 评论 -
【进阶版】 机器学习分类算法之XGBoost(集成学习算法)、LightGBM(梯度提升框架)(13)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-23 14:00:00 · 1033 阅读 · 1 评论 -
【进阶版】机器学习之集成学习介绍、随机森林模型经验贴(12)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-23 12:00:00 · 920 阅读 · 0 评论 -
【进阶版】机器学习之EM经典算法原理+代码(11)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-23 10:00:00 · 1235 阅读 · 3 评论 -
【进阶版】机器学习之贝叶斯分类器细节回顾及原理完善(10)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-23 08:15:00 · 835 阅读 · 0 评论 -
【进阶版】机器学习之支持向量机细节回顾及原理完善(09)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-23 07:00:00 · 728 阅读 · 0 评论 -
【进阶版】机器学习与深度学习之前向传播与反向传播知识(08)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-22 21:35:54 · 660 阅读 · 0 评论 -
【进阶版】机器学习之神经网络与深度学习基本知识和理论原理(07)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-22 21:00:00 · 950 阅读 · 0 评论 -
【进阶版】机器学习之决策树知识与易错点总结(06)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-22 19:00:00 · 783 阅读 · 0 评论 -
【进阶版】机器学习之线性模型介绍及过拟合欠拟合解决方法岭回归、loss回归、elasticnet回归(05)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-22 12:30:00 · 1108 阅读 · 0 评论 -
【进阶版】机器学习之特征降维、超参数调优及检验方法(04)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-22 10:00:00 · 846 阅读 · 0 评论 -
【进阶版】机器学习之特征工程介绍及优化方法引入(03)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-22 08:00:00 · 765 阅读 · 0 评论 -
【进阶版】机器学习之模型性能度量及比较检验和偏差与方差总结(02)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-22 00:30:00 · 1397 阅读 · 11 评论 -
【进阶版】机器学习之基本术语及模评估与选择概念总结(01)
机器学习算法知识、数据预处理、特征工程、模型评估——原理+案例+代码实战机器学习之Python开源教程——专栏介绍及理论知识概述机器学习框架及评估指标详解Python监督学习之分类算法的概述数据预处理之数据清理,数据集成,数据规约,数据变化和离散化特征工程之One-Hot编码、label-encoding、自定义编码卡方分箱、KS分箱、最优IV分箱、树结构分箱、自定义分箱特征选取之单变量统计、基于模型选择、迭代选择机器学习八大经典分类万能算法——代码+案例项目开源、可直接应用于毕设+科研项目。原创 2022-08-21 19:51:16 · 639 阅读 · 0 评论 -
机器学习之自然语言处理——基于TfidfVectorizer和CountVectorizer及word2vec构建词向量矩阵(代码+原理)
目录理论知识准备构造文本特征向量TF-IDF 值sklearn中TfidfVectorizer代码实例CountVectorizer()代码实操Word2Vec代码案例总结每文一语理论知识准备前期我们对分词进行了详细的讲解,那么分词之后,哪些关键词对一个文档才是重要的?比如可以通过单词出现的次数,次数越多就表示越重要。构造文本特征向量Count (文档:空格连接的字符串)TFIDF (文档:空格连接的字符串)Word2Vec (文档:分词列表)TF-IDF 值单词的TF-I原创 2022-05-23 08:00:00 · 1626 阅读 · 0 评论 -
机器学习之自然语言处理——中文分词jieba库详解(代码+原理)
目录文本分类概述文本分类的应用文本分类的挑战文本分类的算法应用文本分类所需知识中文分词神器-jiebajieba分词的三种模式词性标注载入词典(不分词)词典中删除词语(不显示)停用词过滤调整词语的词频关键词提取基于TF-IDF算法的关键词提取基于 TextRank 算法的关键词抽取返回词语在原文的起止位置(论文常用算法)词频统计(附智能程序)每文一语文本分类概述文本分类的应用在大数据时代,网络上的文本数据日益增长。采用文本分类技术对海量数据进行科学地组织和管理显得尤为重要。文本作为分布最广、数据量最原创 2022-05-22 14:43:17 · 4353 阅读 · 49 评论 -
机器学习自然语言处理之英文NLTK(代码+原理)
目录什么是自然语言处理?常用的自然语言处理技术NLTK简介NLTK的功能分词过滤掉停用词词汇规范化(Lexicon Normalization)1)词形还原(lemmatization)2) 词干提取(stem)词性标注获取近义词其他案例每文一语什么是自然语言处理?自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究如何能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。简单地说,自然语言处理( Natural Language Processing,简称 NLP)就是用计算机原创 2022-05-20 21:12:54 · 1964 阅读 · 0 评论 -
基于surprise模块快速搭建旅游产品推荐系统(代码+原理)
实验项目本实验提供收集自互联网公开渠道的 2018 年至 2021 年广东省某市的旅游产业用户评论及评分数据:数据包含以下字段: 用户ID 数据包含对旅游产品进行过评价的1000名用户的编号(2019443) 产品分类 旅游产品的分类,包含“景点”,“酒店”和“餐饮”三大类 产品名称 被评论产品的名称,即酒店名称、景点名称和餐饮名称 产品评分原创 2022-05-12 09:48:03 · 1466 阅读 · 27 评论 -
预测模型构建利器——基于logistic的列线图(R语言)
目录模型知识准备什么是列线图?如何看懂列线图?什么是校准曲线?模型搭建哑变量的设置列线图的绘制校准曲线的绘制每文一语模型知识准备什么是列线图?列线图(Alignment Diagram),又称诺莫图(Nomogram图),它是建立在多因素回归分析的基础上,将多个预测指标进行整合,然后采用带有刻度的线段,按照一定的比例绘制在同一平面上,从而用以表达预测模型中各个变量之间的相互关系。列线图的基本原理,简单的说,就是通过构建多因素回归模型(常用的回归模型,例原创 2022-05-01 23:49:25 · 4435 阅读 · 3 评论 -
机器学习推荐算法之协同过滤(基于物品)【案例+代码】
目录协同过滤算法(基于物品)案例解说总结代码实操每文一语协同过滤算法(基于物品)基于用户的协同过滤,适用于物品较少,用户也不太多的情况。如果用户太多,针对每个用户的购买情况来计算哪些用户和他品味类似,效率很低下。如果商品很多,每个用户购买的商品重合的可能性很小,这样判断品味是否相似也就变得比较困难了。消费者每天都在买买买,行为变化很快,但是物品每天虽然也有变化,但是和物品总量相比变化还是少很多。这样,就可以预先计算物品之间的相似程度,然后再利用顾客实际购买的情况找出相..原创 2022-04-11 00:30:00 · 2807 阅读 · 2 评论 -
机器学习推荐算法之协同过滤(基于用户)【案例+代码】
目录兴趣度计算电影推荐案例协同过滤算法欧式距离案例计算推荐基于用户协同过滤的缺点代码实操每文一语兴趣度计算前面学习了关联规则的相关知识,接下来我们来学习协同过滤。什么是协同过滤呢?我们以一个简单的问题来了解一下:如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么好看的电影推荐。朋友有很多,每一个都去问吗?不是,我们一般更倾向于从口味比较类似的朋友那里得到推荐。协同过滤是利用集体智慧的一种方法,但又稍有..原创 2022-04-10 01:15:00 · 3305 阅读 · 2 评论 -
机器学习推荐算法之关联规则Apriori与FP-Growth算法详解
目录Apriori算法介绍计算菜品间的关联度Apriori算法不足FP-Growth算法频繁项的挖掘关联规则兴趣度apriori代码案例fpgrowth代码案例结果每文一语Apriori算法介绍Apriori,中文是先验,开始的意思。这个算法为了规避前面说到的指数爆炸的问题,采取了提前剪枝的办法。核心是两条定律:定律一:如果一个集合是频繁项集,则它的所有子集都是频繁项集。定律二:如果一个集合不是频繁项集,则它的所有超集都不是频繁项集。Apri...原创 2022-04-10 00:00:00 · 2903 阅读 · 1 评论 -
机器学习推荐算法之关联规则(Apriori)——支持度;置信度;提升度
目录🍎走进关联规则🍊什么是关联规则?🍒关联规则的分类🍉关联规则的基本概念置信度的局限——错估某个关联规则的重要性提升度和零事务的关系先验原则实际案例代码实战频繁项集和支持度置信度调用文末资源推荐每文一语🍎走进关联规则🍊什么是关联规则?🐾🐾情景引入:🍺啤酒与尿布🍼在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直...原创 2022-03-03 19:20:58 · 47359 阅读 · 39 评论 -
【原理+代码】Python实现Topsis分析法(优劣解距离法)
综合评价法评价方法一般分为两类。一类是主观赋权法,多数采取综合咨询评分确定权重,如:综合指数法、模糊综合评价法、层次分析法、功效系数法等。另一类是客观赋权法,根据各指标之间的相关关系或各指标值变异程度来确定权数,如:主成分分析法、因子分析法、理想解法等。那么目前,主要使用的评价方法有:主成分分析法、因子分析法、TOPSIS法(本文详解)、秩和比法、灰色关联法、熵权法、层次分析法、模糊评价法、物元分析法、聚类分析法、价值工程法、神经网络法等。是不是感觉太多了,其实当你踏进机器学习和算法,以及建模的原创 2022-02-19 19:55:16 · 6316 阅读 · 12 评论 -
机器学习分类算法之LightGBM(梯度提升框架)
目录走进LightGBM什么是LightGBM?XGBoost的缺点LightGBM的优化LightGBM的基本原理Histogram 算法直方图加速 LightGBM并行优化代码实践参数详解 代码实操最优模型及参数(数据集1000)模型调参每文一语走进LightGBM什么是LightGBM?在上一篇的文章里,我介绍了XGBoost算法,它是是很多的比赛的大杀器,但是在使用过程中,其训练耗时很长,内存占用比较大。在2017年年..原创 2022-02-17 09:00:00 · 4034 阅读 · 28 评论 -
机器学习分类算法之XGBoost(集成学习算法)
目录走进XGBoost什么是XGBoost?XGBoost树的定义XGBoost核心算法正则项:树的复杂程度XGBoost与GBDT有什么不同XGBoost需要注意的点XGBoost重要参数详解调参步骤及思想XGBoost代码案例相关性分析n_estimators(学习曲线)max_depth(学习曲线)调整max_depth 和min_child_weight调整gamma调整subsample 和colsample_bytree调整正则原创 2022-02-14 10:46:47 · 73987 阅读 · 79 评论 -
机器学习分类算法之随机森林(集成学习算法)
目录什么是集成学习?随机森林随机森林的生成算法随机森林的随机性随机森林的优势随机森林的参数详解随机森林模型提高方法最大特征数(max_features)子树的数量(n_estimators)最重要的最大深度(max_depth)内部节点再划分所需最小样本数(min_samples_split)叶子节点最少样本数(min_samples_leaf)叶子节点最小的样本权重(min_weight_fraction_leaf)最大叶子节点数(max_leaf.原创 2022-02-11 21:25:13 · 6995 阅读 · 31 评论 -
机器学习分类算法之Logistic 回归(逻辑回归)
目录什么是逻辑回归?Sigmoid 函数似然函数梯度下降判定边界损失函数逻辑回归优点逻辑回归缺点代码实现Logistic Regression参数详解正则化选择参数:penalty优化算法选择参数:solver其他参数代码案例结果显示每文一语什么是逻辑回归?逻辑回归算法是用来解决分类问题的。回归与分类的区别在于:回归所预测的目标量的取值是连续的(例如房屋的价格);而分类所预测的目标变量的取值是离散的(例如判断肿瘤大小是否为恶性)。.原创 2022-02-10 00:19:16 · 4750 阅读 · 42 评论 -
机器学习分类算法之支持向量机
目录支持向量机算法背景介绍什么是线性可分?什么又是超平面?支持向量机的三种情况近线性可分线性不可分不用核函数的传统方法核函数Kernel是什么?核函数SVM求解过程核函数的本质代码实例模型调参gamma调参C值调参使用Polynomial kernel进行预测使用RBF kernel进行预测总结每文一语支持向量机算法背景介绍1995年Cortes和Vapnik首先提出了支持向量机(Support Vector Machine),原创 2022-02-08 12:26:49 · 6196 阅读 · 58 评论