机器学习
文章平均质量分 88
主要涉及机器学习相关理论及python实践
Trisyp
及时总结,套路套路套路!!!
展开
-
机器学习(一)K近邻算法(KNN)原理剖析及python实现
k-近邻算法采用测量不同特征值之间的距离方法进行分类原创 2023-04-21 15:20:03 · 641 阅读 · 0 评论 -
机器学习(二)决策树原理剖析及python实现
决策树模型呈树形结构,可以认为是if-then的集合(互斥并且完备:即每一个实例都被一条路径或一条规则所覆盖,而且,只被一条路径或一条规则所覆盖。)或者定义在特征空间与类空间上的条件概率分布原创 2023-05-12 14:24:55 · 828 阅读 · 1 评论 -
Python实现逻辑回归(LogisticRegression)完整过程
最近正在做的项目正好利用到了逻辑回归,所以正好系统的学习了下,本篇博文把自己的学习笔记、项目思路及代码都记录下来。它的计算原理很多网站和书籍都有介绍,就不在这班门弄斧了,主要还是记录自己如何实现一、逻辑回归简介Logistic Regression算法是通过训练数据中的正负样本,学习样本特征和样本标签的假设函数,它是典型的线性分类器,是广义线性模型的一种。它具有很强的可解释性,应用也非常广泛...原创 2019-04-15 19:00:22 · 39121 阅读 · 15 评论 -
Python实现KMeans完整过程
先附上代码,学习笔记回头再补充完整代码如下:# -*- coding: utf-8 -*-# 关闭警告# import warnings# warnings.filterwarnings('ignore')import pandas as pdimport numpy as npfrom scipy.spatial.distance import cdistfrom...原创 2019-04-24 18:15:44 · 1448 阅读 · 0 评论 -
Python实现支持向量机SVM(Support Vector Machine)完整过程
支持向量机(Support Vector Machine)属于有监督的机器学习算法,是一种二分类模型,可用于离散因变量的分类和连续因变量的预测。其本质是计算两个观测数据的距离,学习策略是间隔最大化,所寻找的是能够最大化样本间隔的决策边界,因此又被称为大间距分类器。因为它可使用一个名为核函数的技巧,来将非线性问题变换为线性问题,将低维线性不可分的空间转换为高维线性可分空间,所以它相对于其他单一分类...原创 2019-04-17 10:38:44 · 1988 阅读 · 0 评论 -
Python实现主成分分析、决策树和随机森林完整过程
先附上代码,学习笔记回头再补充完整代码如下:# -*- coding: utf-8 -*-# 关闭警告# import warnings# warnings.filterwarnings('ignore')# 宏观数据和烟草数据回归分析 计算回归系数import pandas as pdimport numpy as npimport matplotlib.pyplo...原创 2019-04-24 18:10:14 · 1804 阅读 · 0 评论 -
推荐系统-算法入门
推荐系统虽然当前我在实践中还不需要用到,但作为数据算法工程师,是需要系统的了解清楚,并且知道如何去使用,它在电商、广告、新闻、小视频等平台上的应用十分广泛,如以推荐为特色的今日头条、抖音等、淘宝、京东等的商品推荐。要了解推荐系统我觉得大方向主要分为三步:是什么、为什么、怎么做。1. 推荐系统——是什么?如果定义推荐系统,则有:其中,C是全体用户集合,S为全部商品/推荐内容集合,u是评判把推荐的好坏评判函数,推荐是对于,找到,使得u最大。通俗来讲,推荐系统就是根据用户的历史行为、社交关系、兴趣原创 2021-02-02 11:22:57 · 441 阅读 · 0 评论 -
机器学习-可行性分析入门
文章地址:https://www.jianshu.com/p/23949ca4f8ab文章写的比较容易理解,但仅仅对二分类的学习问题可行性进行讨论,并非所有的机器学习输出空间都是二值的,其他类型的需要更深入的学习了。文章参考资料:[1] Learning From Data(网易公开课).[2] 林轩田机器学习基石(B站公开课).[3] No Free Lunch Theorems.[4] 机器学习为什么可行的上、中、下(知乎八汰).[5] 机器学习 - 学习理论(博客园viredery)转载 2020-09-12 16:16:59 · 251 阅读 · 0 评论