课程学习
农夫小田
心脏跳动 && 北京上天大学 - 辛劳学籽
展开
-
【某航】k-means聚类t-sne可视化——数据挖掘导论
代码链接:github代码1.任务要求分析Clustering_ALS数据集,对疾病类型进行聚类分析。2.读取数据:ALS.csv 2223 rows × 101 columns3.数据分析与可视化(1)数值型数据分布统计:(data_distribute.png)对每一列数据绘制直方图(质量分布图),它是表示数据分布情况的一种主要工具。其中y轴是密度,而不是概率。通过对每一类列数据做数据分布的统计,可以看到数据大致的分布情况,SubjectID 该类特征数值较大,分布与其他数据不一致性,不原创 2020-07-18 20:42:16 · 1625 阅读 · 0 评论 -
【某航】tf-idf文本特征提取与SVM分类——数据挖掘导论
代码链接:github代码1.任务要求(1)将数据集Case1-classification.zip中的email文件转换成列表数据,利用tf-idf方法提取其中的特征(2)使用SVM分类文本类型,通过5折交叉验证检测分类结果,输出precision, recall, F1-score(可以使用LIBSVM实现SVM)2.数据预处理与特征提取数据预处理:Emails_classify/Emails_classify_Proprocessing.py 文件中执行。下面详细描述提取特征方法:读取文原创 2020-07-18 20:24:00 · 2728 阅读 · 0 评论 -
【某航】关联规则分析CatalogCrossSell数据集——数据挖掘导论
代码链接:github代码1.任务目标针对所提供的CatalogCrossSell.xls数据集,要求对该数据及进行关联规则分析,并且解释生成的结果,评价指标包括lift,ratio, confidence, support等,并且最后根据这些结果为Exeter做出合理建议:2.分析数据集:给定的数据包含两个sheet,第一个为解释文档,第二个为真实数据集,该数据集包含4998行数据,第一列是用户编号,后面分别为Clothing,House wares, Health, Automotive, P原创 2020-07-18 19:08:13 · 3490 阅读 · 2 评论 -
维度灾难--通过Python理解高维空间欧氏距离与余弦相似度失效
代码链接:github代码维度灾难维数灾难(Curse of Dimensionality):通常是指在涉及到向量的计算的问题中,随着维数的增加,计算量呈指数倍增长的一种现象。维数灾难涉及数字分析、抽样、组合、机器学习、数据挖掘和数据库等诸多领域。此处讨论高维情况下,距离函数的计算是否具有意义。欧氏距离与余弦相似度区别欧氏距离衡量的是空间各点的绝对距离,跟各个点所在的位置坐标直接相关;而余弦距离衡量的是空间向量的夹角,更加体现在方向上的差异,而不是位置。欧氏距离能够体现个体数值特征的绝对差异,所原创 2020-07-18 18:50:57 · 4970 阅读 · 1 评论 -
【某航】队列模型(MM1)设计与仿真
一、 实验目的应用M/M/1队列编程思想,模拟超市收银排队等待的过程,熟悉离散事件推进方式、队列建立和提取方式。二、 数学模型1、 首先确定模型框架,即核心是创建一根事件轴和一支队列。先判定事件轴是否忙碌,是就根据时间先后顺序让顾客进入队列,否则推进事件构建时序推进的离散事件仿真模型,此处编写代码采用基于活动的方法推进仿真时钟,使用固定时间间隔和基于规则的方法来决定是否开始一个活动,在每到一个固定的时间节点,就检查条件,判定此时处于哪个活动,并触发相应活动的条件,直到整个时间推进超出规定的阈值范围。原创 2020-07-18 18:16:36 · 4791 阅读 · 6 评论 -
【某航】决策树分类学习--人工智能课程大作业
1. 决策树原理决策树归纳是最简单但最成功的学习算法之一。决策树(DT)由内部和外部节点以及组成节点之间的互连称为树的分支。内部节点是一个决策单元根据不同决定下一个要访问的子节点相关变量的可能值。相比之下,外部节点也称为树叶节点,是分支的终止节点。它没有任何子节点并且是与用来描述给定数据的类标签相关联。决策树是树中的一组规则结构,其中的每个分支都可以被解释为沿着这个分支访问的节点与之相关的决策规则。决策树通过从树根到树叶节点对树进行排序来对实例进行分类。这个树形结构的分类器将数据集的输入空间递归分割互相原创 2020-07-17 22:34:01 · 4154 阅读 · 5 评论 -
【某航】A*算法实现十五数码问题--人工智能课程大作业
15数码问题是在4×4方格盘上,放有15个数码,剩下一个位置为空(方便起见,用0表示空),每一空格其上下左右的数码可移至空格。本问题给定初始位置和目标位置,要求通过一系列的数码移动,将初始状态转化为目标状态。状态转换的规则:空格四周的数移向空格,我们可以看作是空格移动,它最多可以有4个方向的移动,即上、下、左、右。问题的求解方法,就是从给定的初始状态出发,不断地将空格上下左右的数码移至空格,将一个状态转化成其它状态,直到产生目标状态。原创 2020-07-17 00:29:30 · 12143 阅读 · 22 评论