【数据科学与大数据技术】
文章平均质量分 82
UML、JavaWeb、大数据处理技术、大数据存储技术
小手の冰凉
数据挖掘
数据结构算法
杂谈
展开
-
部署基于efk+logstash+kafka构建日志收集平台并对nginx日志进行分析【待执行】
Filebeat采集日志kafka topic存起来日志->logstash去kafka获取日志,进行格式转换->elasticsearch->kibana。原创 2023-10-24 09:40:51 · 761 阅读 · 0 评论 -
【淘宝用户购物行为分析】数据挖掘实验四
Apriori算法的基本思想是利用频繁项集的性质,即如果一个项集是频繁的,那么它的所有子集也是频繁的。该算法从单个项集开始,逐渐生成更大的项集,直到不能再生成频繁项集为止。算法采用逐层扫描的方法,通过连接步骤生成候选项集,然后通过剪枝步骤排除非频繁项集,最终得到频繁项集。生成候选项集: 初始阶段,生成所有单个项的候选项集。扫描数据集: 统计候选项集在数据集中的支持度(出现次数)。剪枝: 剪枝步骤通过判断候选项集的支持度是否满足最小支持度阈值,从而剪除非频繁项集。原创 2023-10-19 09:21:16 · 1499 阅读 · 2 评论 -
【基于Kmeans、Kmeans++和二分K均值算法的图像分割】数据挖掘实验三
【代码】【基于Kmeans、Kmeans++和二分K均值算法的图像分割】数据挖掘实验三。原创 2023-10-14 18:33:08 · 1398 阅读 · 0 评论 -
【手写数字识别】GPU训练版本
【代码】【手写数字识别】GPU训练版本。原创 2023-10-10 23:14:22 · 656 阅读 · 1 评论 -
【手写数字识别】数据挖掘实验二
计算机通过手写体图片来识别出图片中的字,与印刷字体不同的是,不同人的手写体风格迥异,大小不一,造成了计算机对手写识别任务的一些困难。此实验内容:分别采用决策树、KNN、朴素贝叶斯、SVM、BP、softmax、adaboost、袋装八种浅层学习分类方法中的任意二种方法(适于二人组)或 三种(适于三人组)对。(4) 不同方法对HWDG数据集分类识别结果分析(不同方法识别率对比表及结果分析)。(3) 不同方法对MNIST数据集分类识别结果分析(不同方法识别对比率表及结果分析)。(1) 数据集描述。原创 2023-10-09 11:38:54 · 2134 阅读 · 0 评论 -
【线性回归、岭回归、Lasso回归分别预测患者糖尿病病情】数据挖掘实验一
(详细描述数据集:如特征属性名称及意义、记录数等)(写出项目中涉及的主要算法原理及模型评价方法)原创 2023-09-18 00:56:06 · 2328 阅读 · 4 评论 -
【股票价格走势预测】数据挖掘实验一
数据挖掘实验1(股票)原创 2023-09-15 10:57:13 · 1877 阅读 · 1 评论 -
【编译原理】机测程序题
【代码】【编译原理】机测笔记。原创 2023-09-13 21:45:39 · 266 阅读 · 1 评论 -
【编译原理】学习笔记
摆烂原创 2023-09-06 15:40:52 · 151 阅读 · 0 评论 -
【数据挖掘】学习笔记
< 数据预处理 >原创 2023-09-05 14:34:48 · 1126 阅读 · 0 评论 -
【Spark大作业】财政收入影响因素分析及预测模型
财政收入影响因素分析及预测模型原创 2023-06-29 15:25:57 · 2290 阅读 · 0 评论 -
【Spark大作业】Spark快速大数据分析综合考察
Spark大作业原创 2023-06-26 16:16:08 · 779 阅读 · 1 评论 -
【 计算机组成原理 】期末重点
文章目录第一章 【计算机系统概论】1.1 知识点1.1核心例题第二章 【运算方法和运算器】2.1 知识点2.2 核心例题第三章 【存储系统】3.1 知识点3.2 核心例题第四章 【指令系统】4.1 知识点4.2 核心例题第五章 【中央处理器】5.1 知识点5.2 核心例题第六章6.1 知识点6.2 核心例题第七章7.1 知识点7.2 核心例题第八章8.1 知识点8.2 核心例题第一章 【计算机系统概论】1.1 知识点计算机的性能指标1.1核心例题第二章 【运算方法和运算器】2.1 知识点原创 2023-06-21 10:48:34 · 723 阅读 · 0 评论 -
【数据可视化】大作业(意向考研高校的数据可视化)
将该高校的地理位置以地图的形式展示。将该高校近几年计算机相关专业的考研(或高考)录取成绩、人数信息,专业师资队伍,考试科目及内容等等以合适的柱状图、折线图、饼图等方式表示出来,图表能够清晰得呈现不同数据的变化,使得观察图表的人能够迅速得获取信息。录取成绩、人数信息、专业师资队伍柱状图、折线图、饼图对个人感兴趣的导师、研究方向等多属性、多维度、多关系数据选用关系、词云等可视化方法,使数据清晰有效地表达。研究方向关系、词云其它自由发挥部分学校名称:山东理工大学。原创 2023-06-18 17:08:24 · 7966 阅读 · 5 评论 -
【软件测试】测试用例设计要点总结
文章目录考试题型:(一) 等价类划分1.1 划分等价类1.2 设计测试用例(二) 边界值分析2.1 列出边界值分析表2.2 设计测试用例(三) 因果图分析3.1 确定原因和结果3.2 确定原因和结果之间的逻辑关系3.3 在因果图上使用标准的符号标明约束条件(四) 判定表驱动4.1 将因果图转换为判定表4.2 设计测试用例(五) 逻辑覆盖(六) 基本路径测试6.1 画出程序控制流程图6.2 计算程序环路复杂性6.3 确定独立路径集合6.4 设计测试用例考试题型:简答题 (共 4 题,每题原创 2023-06-13 21:49:37 · 1981 阅读 · 2 评论 -
【软件测试】第1章 软件测试概述
【软件测试】第1章 软件测试概述原创 2023-04-25 09:30:45 · 1885 阅读 · 0 评论 -
【软件测试】第2章 黑盒测试
黑盒测试:功能测试或数据驱动测试测试对象:需求规格说明书和用户手册动态黑盒测试分类:功能测试:等价类划分、边界值分析、因果图、错误推测、判定表、功能图法非功能测试:性能测试、强度测试、兼容性测试、配置测试、安全性测试。原创 2023-05-09 09:39:20 · 984 阅读 · 0 评论 -
【软件测试】第3章 白盒测试
系列文章目录文章目录系列文章目录前言【 第三章 白盒测试 】3.1 逻辑覆盖3.2 基本路径测试3.3 静态白盒测试技术3.4 其他白盒测试方法3.5 白盒测试策略3.6 黑盒测试与白盒测试的比较总结前言【 第三章 白盒测试 】3.1 逻辑覆盖逻辑覆盖的类型:语句覆盖:每条可执行语句判定(分支)覆盖:每条分支路径条件覆盖:每个判断的每个条件的所有可能取值判定/条件覆盖:每个分支路径和每个判断的每个条件的所有可能取值条件组合覆盖:每个判断的所有可能的条件取值组合路原创 2023-05-24 15:57:29 · 1034 阅读 · 0 评论 -
【软件测试】在线测试汇总
等待WPS会员,PDF转JPG原创 2023-06-12 16:21:15 · 221 阅读 · 0 评论 -
【Spark编程基础】
【 Spark编程基础 】原创 2023-03-06 09:42:53 · 1073 阅读 · 0 评论 -
【Spark编程基础】第7章 Structured Streaming
Structured Streaming的关键思想是将实时数据流视为一张正在不断添加数据的表可以把流计算等同于在一个静态表上的批处理查询,Spark会在不断添加数据的无界输入表上运行计算,并进行增量查询在无界表上对输入的查询将生成结果表,系统每隔一定的周期会触发对无界表的计算并更新结果表。原创 2023-05-17 10:25:07 · 2179 阅读 · 0 评论 -
【Spark基础编程】 第8章 Spark MLlib
机器学习可以看做是一门人工智能的科学,该领域的主要研究对象是人工智能。机器学习利用数据或以往的经验,以此优化计算机程序的性能标准。机器学习强调三个关键词:算法、经验、性能。原创 2023-06-10 17:00:04 · 2554 阅读 · 2 评论 -
【大数据处理技术】第一篇 大数据基础(暂停更新)
大数据技术原理与应用(第一篇 大数据基础)原创 2022-11-06 21:54:53 · 170 阅读 · 0 评论 -
【大数据处理技术】第二篇 大数据存储与管理(暂停更新)
【大数据处理技术】第二篇 大数据存储与管理原创 2022-11-21 11:13:22 · 1435 阅读 · 0 评论 -
【大数据处理技术】第三篇 大数据处理与分析(暂停更新)
【大数据处理技术】第三篇 大数据处理与分析原创 2022-11-07 17:41:31 · 1004 阅读 · 0 评论 -
【大数据存储技术】第4章&第5章 HBase 原理与使用
【大数据存储技术】第4章&第5章 HBase 原理与使用原创 2022-11-23 17:21:38 · 717 阅读 · 1 评论 -
【大数据存储技术】第7章 MongoDB 的原理和使用
【大数据处理技术】第7章 MongoDB 的原理和使用原创 2022-11-23 16:52:25 · 1189 阅读 · 0 评论 -
【大数据存储技术】第8章 其他NoSQL数据库
【大数据存储技术】第8章 其他NoSQL数据库原创 2022-11-08 15:49:43 · 935 阅读 · 0 评论 -
【大数据存储技术】思考题及参考答案
NoSQL数据库会采用非关系的数据模型弱化模式或表结构、弱化完整性约束、弱化甚至取消事务机制可能无法支持,或不能完整的支持SQL语句目的是实现强大的分布式部署能力——一般包括分区容错性、伸缩性和访问效率(可用性)等NoSQL大多是开源免费的CAP是指分布式系统中的Consistency(一致性)、Availability(可用性)、Partition tolerance(分区容错性)。Consistency(一致性)是指分布式系统中所有节点都能对某个数据达成共识。原创 2022-11-18 11:55:49 · 2271 阅读 · 0 评论 -
【考前笔记】UML
UML考前笔记原创 2022-10-26 16:32:39 · 186 阅读 · 0 评论 -
【软件建模与UML】
《UML与Rose建模实用教程》+《智慧树(部分)》原创 2022-10-28 20:59:03 · 1552 阅读 · 0 评论