数据分析
文章平均质量分 68
xiaoyalian
这个作者很懒,什么都没留下…
展开
-
R语言数据质量分析
数据质量分析是数据预处理的,也是数据分析结论和的基础。数据质量分析的主要任务是检查原始数据中是否存在脏数据。脏数据一般包括;原创 2024-03-19 23:51:10 · 861 阅读 · 1 评论 -
复杂网络分析(day1)
复杂网络分析是一种研究网络结构和动态行为的方法。复杂网络包括了许多连接和相互作用的节点,这些节点可以是人、物体、信号或其他系统的组成部分。在复杂网络分析中,我们可以通过分析网络的拓扑结构、节点的属性和相互关系等方面来理解网络的性质和行为。以下是一些复杂网络分析的示例:社交网络分析:对社交网络中的关系进行分析,探查社交网络中的群体结构、节点的中心度、社交影响力等。网络流动性分析:分析物流、交通或信息网络中节点和边的流动性,研究网络的拥塞、传播效率等问题。蛋白质相互作用网络分析。原创 2024-03-14 23:27:55 · 485 阅读 · 1 评论 -
K-均值聚类算法
是一种常用的无监督学习算法,用于将一组数据分成K个不同的簇。该算法基于以下假设:每个簇的中心点,也称为质心,是该簇中所有数据点的平均值。该算法通过迭代计算来更新每个簇的质心位置,以最小化簇内成员与质心之间的距离平方和。初始化K个质心的位置。对每个数据点,计算其与每个质心之间的距离,将其归类到最近的质心所属的簇。更新每个簇的质心位置为该簇内所有数据点的平均值。重复步骤2和步骤3,直到质心位置不再改变或达到最大迭代次数。:该算法简单且易于理解和实现,适用于初学者。原创 2024-03-12 17:24:52 · 754 阅读 · 1 评论 -
python模拟高考录取
定义投档状态和录取状态的字典# 遍历每个考生# 初始化投档状态,将每个志愿的投档状态全部置为Falseadmission_status[row['考生编号']] = {j:False for j in range(1,9)}# 遍历每个志愿,找到可以投档的志愿major = row[f'志愿def admission(df , plans_dict) : # 定义投档状态和录取状态的字典 admission_status = {原创 2024-03-08 19:57:21 · 1647 阅读 · 1 评论