自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 数据挖掘知识点复习

EM聚类通过迭代过程来估计数据的隐变量(即簇的成员资格)和模型参数(即簇的中心和协方差),直到收敛。这些模式可以是分类(将数据分为不同的类别)、聚类(将数据分组,使得同一组内的数据相似度高,不同组之间的数据相似度低)、关联规则学习(发现变量之间的有趣关系)、异常检测(识别数据中的异常或离群点)等。1. **数据预处理**:这是数据挖掘的第一步,包括数据清洗(去除错误和不一致的数据)、数据集成(合并来自不同来源的数据)、数据选择(选择与分析任务相关的数据子集)以及数据变换(将数据转换成适合挖掘的形式)。

2024-06-23 18:06:15 941

原创 【NoSQL】复习资料

WAL是HBase用来记录数据更新操作的一种日志,可以保证系统发生故障时数据能够及时地恢复到正常状态。使用HLog文件恢复数据的过程如下。① Master主服务器处理发生故障的RegionServer上的HLog文件。② 系统根据HLog文件中每条日志记录所属的Region,对其中的数据进行拆分,并分别放到相应Region目录下。③ 将失效的Region重新分配到正常工作的RegionServer中,并将该Region相关的HLog文件也发送到该RegionServer中。

2024-06-09 20:04:33 675 3

原创 【Spark】用scala语言带你手撕KNN算法在海伦约会上的应用

当然是没有啦,哈哈,在这里博主给出了,但是该算法在模型评估上还存在较大问题,并没有实现类似于其他算法的模型评估指数,对于模型的正确率还有待考量,有厉害的大佬欢迎批评指正和完善,好啦,就这么多了。一般来说,大家会创建scala项目,而非maven管理的Scala项目,但由于idea版本的变化,添加Maven管理的方式也不同,博主在创建时也遇到了很多问题,参照了以下两篇博文,大家可以根据下面两篇博文将项目创建好,创建好的项目一定会有pom.xml文件,这样才可以添加依赖。,并对其进行必要的预处理。

2024-06-07 18:02:40 344

原创 【Spark大数据分析】Spark大数据分析复习资料

算法:对数据做归一化处理,计算当前样本和所有训练样本的距离,对距离排序,选择最近的K个样本,统计样本出现的频率,出现频率最多的样本作为预测类别。Spark GraphX基于pregel计算“5万结点、250万条边”图的单源最短路径,大概用时8分钟(8核心16线程,4.0G主频 CPU)1GB文件单词计数,大概用时1分钟-2分钟(8核心16线程,4.0G主频 CPU,分区数为16,集群中无其他作业调度使用)//输出分数为100分的学生的“学号、课程号、分数”,并统计100分的人数。

2024-06-04 17:55:10 909 1

原创 带你快速复习深度学习理论知识

深度学习是一个高度复杂的非线性回归方法和机器学习算法,它的概念源于人工神经网络的研究,强调从连续层中学习。其中深度在某种意义上是指神经网络的层数,而学习是指训练这个神经网络的过程。2、深度学习和机器学习的区别最大区别在于二者提取特征的方式不同:深度学习具备自动提取抽象特征的能力,机器学习大多是人们手动选取特征和构造特征。

2024-05-30 19:32:25 806

原创 校园智能管理平台搭建-1

二是由承建方代管的管理方式。应用物联网技术,可以实现建筑智能化子系统或集成系统运行状态的远程监视和故障诊断,为建筑使用者或拥有者上传智能化系统运行状态、运行记录、系统监控界面,为智能化系统建设方提供建筑智能化系统运行的监视、查询、维护和管理。更为重要的是,通过合理地规划前后端接口,我们确保了系统的模块化,为后续的维护和扩展打下了坚实的基础。实现数据共享,避免信息孤岛:智能校园管理系统旨在实现学校各项业务的信息化管理,搭建各部门间信息共享的桥梁,保证学校各项数据的权威和质量,为学校领导的决策提供数据支持。

2024-02-19 20:36:22 1085 1

原创 校园智能管理平台搭建-2

【代码】校园智能管理平台搭建-2。

2024-02-19 20:35:34 373 1

原创 【人工智能】基于分类算法的学生学业预警系统应用

党的二十大报告指出:“我们要坚持教育优先发展、科技自立自强、人才引领驱动,加快建设教育强国、科技强国、人才强国,坚持为党育人、为国育才,全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之”。学生是祖国的未来,如何培养出优秀的接班人是学校管理部门常思的一个问题,即如何激发每一个学生的学习潜能,为中华民族的伟大复兴贡献一份力量。

2024-01-07 22:10:45 1960 10

原创 【python机器学习】知识点的复习重点

通过观察碎石图中的变化趋势,可以确定最佳的聚类数目K,使得各类别之间具有较大的差异,同时保持较小的类别内方差。总结起来,经验误差和泛化误差都是用来评估分类模型的性能,但经验误差评估模型在训练数据上的拟合程度,泛化误差评估模型对未知数据的预测能力。在每次迭代中,样本的权重会根据其被前一个弱分类器的分类效果来调整,错分的样本权重会增加,正确分类的样本权重会减少。训练误差最小时的测试误差不一定最小,即训练误差最小时的预测模型,其泛化能力不一定最强,理想的预测模型应是泛化能力最强的模型,是测试误差最小的模型。

2024-01-07 21:46:03 1104 2

原创 学生学业预警系统设计

当系主任点击学生学业预警结果时,页面将显示自己所管理的学生的预警信息,对学生学业预警信息的操作包括:学业预测和添加评价,系主任下的学生学业预警结果界面。系统实现后能够及时发布通知公告、发送预警信息,大大降低高校大学生学业失败的风险,提高学生的毕业率,提高教学工作的效率和质量,能够更大范围的培养人才,对学生的各项影响因素进行分析,分析影响因素之间存在的依赖关系对学生学业预警结果的影响,深入发掘学生数据中的重要信息,帮助学生更好地进行自我管理,保证学生学业的顺利和学校教学水平的提高。

2023-12-25 15:42:04 1409 1

原创 计算机操作系统试题

当各个作业要求运行的时间相同时,等待时间长的作业得到优先调度。34、在多道程序环境中,用户程序的相对地址与装入内存后的实际物理地址不同,把相对地址转换为物理地址,这是操作系统的地址重地位功能。24、在设备管理中,为了克服独占设备速度较慢、降低设备资源利用率的缺点,引入了虚拟分配技术,即用共享设备模拟独占设备。28、在请求页式管理中,当硬件变换机构发现所需的页不在内存时,产生缺页中断信号,中断处理程序作相应的处理。30、在段页式存储管理系统中,面向用户的地址空间是段式划分,面向物理实现的地址空间是页式划分。

2023-12-17 10:56:24 532 1

原创 Linux系统相关知识点

12.将/home/stud1/Wang目录做归档压缩,压缩后生成wang.tar.gz文件,并将此文件保存到/home目录下,实现此任务的tar命令格式 tar -zcvf /home/wang.tar.gz /home/stud1/Wang。41、 在使用手工的方法配置网络时,可通过修改 /etc/hostname 文件来改变主机名,若要配置该计算机的域名解析客户端,需配置 /etc/resolv.conf 文件。

2023-12-17 10:53:20 463 1

原创 概率论各章要点及公式复习

概率论复习法宝

2023-12-15 22:36:57 342

原创 软件重点工程考试试卷答案

第二种回答:白盒测试是去研究里面的源代码和程序结构,白盒法测试法把测试对象看作一个打开的盒子,测试人员须了解程序内部结构和处理过程,以检查处理过程的细节为基础,对程序中尽可能多的逻辑路径进行测试,检验内部控制结构和数据结构是否有错,实际的运行状态与预期的状态是否一致。结构化程序设计是进行以模块功能和处理过程设计为主的详细设计的基本原则。模块化:就是把程序划分成若干模块,每个模块完成一个子功能,把这些模块集合起来组成一个整体,可以完成指定的功能,在软件的体系结构中,模块是可组合、分解和更换的单元。

2023-12-15 22:27:37 1070

原创 【结构体】【校园编程网排名】你会用C语言对给定数据排名了吗?

#include<stdio.h>struct student{ int ord; char uid[100]; int ac; int submit;};main(){ struct student stu[100]; struct student temp; int n,i,j; scanf("%d",&n); for(i=0;i<n;i++) { scanf("%s %d %d",&stu[i].uid,&stu[i].ac.

2022-01-14 16:36:49 115

原创 三天打鱼两天晒网你C会了吗?

三天打鱼两天晒网你C会了吗?

2022-01-14 15:57:22 94

海伦约会测试集data-test.txt

海伦约会测试集data-test.txt

2024-06-07

海伦约会部分训练集data-train.txt

海伦约会部分训练集data-train.txt

2024-06-07

深度学习具体案例手算讲解视频

包括前向传播、反向传播、卷积,池化,参数消耗

2024-05-30

学业失败预警训练集数据

学业失败预警训练集数据

2024-05-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除