算法
文章平均质量分 77
python收藏家
这个作者很懒,什么都没留下…
展开
-
Scikit Learn中支持单变量特征选择的SVM示例
支持向量机(SVM)是一种强大的机器学习算法,用于分类和回归分析。它是基于找到两个类之间的最佳边界,最大限度地提高它们之间的差距的想法。然而,SVM的挑战在于它需要大量的计算能力,并且对特征的选择很敏感。这可能会使模型更加复杂,更难解释。单变量特征选择是一种用于选择数据集中最重要特征的方法。这种方法背后的思想是评估每个特征与目标变量的关系,并选择具有最强相关性的特征。对每个特征重复此过程,并根据定义的标准(如最高相关性或统计显著性)选择最佳特征。原创 2024-06-13 20:18:49 · 944 阅读 · 0 评论 -
Apriori算法
Apriori算法由R. Agrawal和R. Srikant于1994年在数据集中寻找布尔关联规则的频繁项集。该算法的名称是Apriori,因为它使用了频繁项集属性的先验知识。我们应用迭代方法或逐层搜索,其中k-频繁项集用于找到k+1个项集。为了提高频繁项集逐层生成的效率,使用了一个重要的属性Apriori属性,该属性有助于减少搜索空间。频繁项集的所有非空子集必须是频繁项集。Apriori算法的核心概念是支持度的反单调性。Apriori假设,频繁项集的所有子集必须是频繁的(Apriori属性)。原创 2023-11-17 17:21:48 · 96 阅读 · 0 评论 -
ICA独立成分分析
ICA独立成分分析原创 2023-03-12 17:15:00 · 667 阅读 · 0 评论 -
主成分分析(PCA)原理
主成分分析(PCA)原理学习记录原创 2023-03-09 18:30:00 · 1948 阅读 · 0 评论 -
数据清洗和特征选择
数据清洗和特征选择原创 2023-03-08 18:30:00 · 961 阅读 · 0 评论 -
机器学习中的距离和相似性计算以及python实现
机器学习中的距离和相似性计算以及python实现原创 2023-03-07 17:45:00 · 606 阅读 · 0 评论 -
scikit-learn实现近邻算法分类的示例
python数据挖掘入门与实践 第二章代码笔记原创 2023-02-27 15:58:17 · 342 阅读 · 0 评论 -
python3 cookbook中常遇问题的解答记录
python3 cookbook中常遇到问题与解答记录原创 2023-02-06 18:10:56 · 384 阅读 · 0 评论 -
电影评分预测案例--梯度下降法和ALS(交替最小二乘法)实现
1. 梯度下降法import numpy as npimport pandas as pddtype = {'userId': np.int32, 'movieId': np.int32, 'rating':np.float32}ratings = pd.read_csv('./ml-latest-small/ratings.csv', dtype=dtype, usecols=range(3))# 计算用户和物品各自分组后的评分users_ratings = ratings.groupby原创 2021-02-24 20:14:40 · 835 阅读 · 0 评论 -
推荐系统--基于用户物品的协同过滤示例(使用jaccard相似度)
import pandas as pdimport numpy as npusers = [f"User{i}" for i in range(1,6)]items = [f"Item{i}" for i in 'ABCDE']#假设用户购买记录datasets = [ [1,0,1,1,0], [1,0,0,1,1], [1,0,1,0,0], [0,1,0,1,1], [1,1,1,0,1],]df = pd.DataFrame(datasets原创 2021-02-22 13:44:07 · 746 阅读 · 0 评论 -
机器学习算法笔记(逻辑回归)
逻辑回归分类预测逻辑回归介绍和应用逻辑回归介绍逻辑回归应用算法实战demo实践1. 库函数导入2. 模型训练3. 数据和模型可视化4. 模型预测基于鸢尾花(iris)数据集的逻辑回归分类实践1. 库函数导入2. 数据读取和载入3. 可视化描述4. 利用 逻辑回归模型 在二分类上 进行训练和预测5. 利用 逻辑回归模型 在三分类(多分类)上 进行训练和预测重要知识点逻辑回归介绍和应用逻辑回归介绍逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分原创 2021-01-30 15:37:24 · 142 阅读 · 0 评论 -
python实现简单的排序算法
# 冒泡排序'''原理冒泡排序(Bubble Sort)是一种简单的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。步骤冒泡排序算法的运作如下:比较相邻的元素。如果第一个比第二个大,就交换他们...原创 2018-07-10 20:02:18 · 150 阅读 · 0 评论