- 博客(83)
- 收藏
- 关注
原创 最全的 数据分析/机器学习/深度学习/数据挖掘 项目实战集合
1、关于房间传感器监测数据集的探索2、EEMD-LSTM模型择时策略 — 1.EEMD分解与LSTM模型搭建3、EEMD-LSTM模型择时策略 — 2. 量化回测4、国际超市电商销售数据分析5、基于问卷调查数据的多元统计数据分析与预测(因子分析、对应分析与逻辑回归)6、手写文本识别7、语音情感识别8、电商会员门店消费数据分析9、糖尿病风险预测模型分析与构建10、基于卷积神经网络(CNN)和ResNet50的水果与蔬菜图像分类系统11、学生抑郁情况可视化分析及预测
2025-02-21 09:50:35
433
原创 解决哈希冲突的4种主要的解决方案
方法时间复杂度(平均)时间复杂度(最坏)空间复杂度主要缺点链地址法O(1)O(n)O(n)需要额外指针空间线性探测O(1)O(n)O(1)聚集现象严重二次探测O(1)O(n)O(1)二次聚集,需要质数表大小双重哈希O(1)O(n)O(1)计算开销较大哈希冲突解决技术的分类体系实际应用:使用链地址法(链表长度>8时转为红黑树):使用开放寻址法(类似二次探测的变体):通常使用链地址法MarkdownText-to-HTMLAuthorsJohnLuke。
2026-03-17 14:34:11
296
原创 Go语言垃圾回收机制详解与图解
写屏障(Write Barrier)是Go能在并发标记时保证正确性的核心技术。(特别是STW时间)。它不是一个"停止世界"的GC,而是尽可能与用户程序并发执行。我将详细解释Go语言的垃圾回收机制,并为您绘制示意图说明其核心原理。理解其工作原理有助于编写更高效、可预测的Go程序。这是理解Go GC的基础。Go的GC是一个持续优化的复杂系统,其核心是在。这个阶段非常短,通常<100µs。
2026-01-26 14:06:02
434
原创 Golang 常用工具
模块面试关键点工具goroutine 泄漏阻塞未退出内存泄漏对象未释放 / 缓存过多heap 分析net/httptimeout 设置Mutex普通 / 饥饿模式sync.MutexChannel环形队列 + 等待队列GC三色标记清除 + 并发回收GOGCcontext取消传播机制WithCancelselect伪随机调度。
2026-01-08 17:33:29
521
原创 驾驶员行为检测:基于卷积神经网络(CNN)的识别方法
本文介绍了基于CNN的驾驶员行为检测项目,使用AlexNet、VGGNet和ResNet三种网络结构对五种驾驶行为(安全驾驶、打电话、发短信、转弯、其他活动)进行分类。项目详细展示了从数据预处理到模型构建的全过程,包括图像导入、数据拆分、超参数设置等步骤。通过比较不同CNN结构的性能表现,为驾驶员行为分析提供有效解决方案。文章还建议了后续改进方向,如连接摄像头实时检测和构建语音报警系统。完整代码和数据可通过指定链接获取。
2026-01-08 16:38:21
884
原创 实时事故检测与交通分析计算机视觉系统
🚨 项目概述本先进计算机视觉系统利用闭路电视监控视频,提供实时事故检测与综合交通分析能力。项目采用尖端深度学习算法,自动识别车辆碰撞、监测交通流量,并为紧急救援团队生成即时警报。核心技术栈研究贡献政府及市政部门私营部门研究机构第一阶段:核心系统(已完成)第二阶段:高级功能(进行中)第三阶段:企业部署安全改进经济效益输出:探索数据集结构输出:高级配置类具备特征提取功能的先进车辆跟踪器 / 具备特征提取能力的高级车辆追踪系统深度学习事故检测模型精度评估与模型评价输出:输出:事故
2025-11-26 10:21:53
766
原创 Bellman–Ford 最短路径算法详解
摘要: Bellman–Ford 算法是一种用于求解带负权边图的单源最短路径问题的经典算法。相比 Dijkstra 算法,它能检测负权环并处理负权边,但时间复杂度更高(O(V·E))。算法通过 V-1 次松弛操作更新最短路径,最后额外一次松弛检测负权环。本文详细解析了算法原理、Go 实现代码(含完整注释)、与 Dijkstra 的对比及其应用场景(如金融套利检测、网络路由等)。Bellman–Ford 在负权图优化、金融建模等领域具有独特价值。
2025-11-18 15:35:02
488
原创 基于 YOLOv11 的先进交通标志检测系统
摘要 本文基于YOLOv11n模型对15类交通标志进行目标检测,包括红绿灯、限速标志和停车标志等。通过Albumentations进行数据增强(如模糊、灰度化、CLAHE等),提升模型鲁棒性。训练采用AdamW优化器,结合Mosaic增强、标签平滑和DFL损失等技术优化性能。评估使用mAP、Precision和Recall等指标,并通过PR曲线、混淆矩阵等可视化分析模型表现。实际测试验证了模型在复杂交通场景中的实时性与准确性,适用于自动驾驶等实际应用。
2025-11-18 14:44:54
875
原创 Articulation Point(割点)算法详解
🧠 割点算法摘要 割点(Articulation Point)是指无向图中删除后会增加连通分量数的顶点。算法基于DFS和时间戳(Tarjan思想): 通过DFS为每个节点分配discoveryTime 计算节点能回溯到的最早时间戳earliestDiscovery 当子节点的earliestDiscovery >= discoveryTime[父节点]时,父节点是割点 根节点需单独判断(子节点数≥2才是割点) 核心公式:low[child] >= disc[parent] 时间复杂度O(V+E
2025-11-17 17:02:25
957
原创 基于深度卷积神经网络与迁移学习的动物图像分类
本文提出了一种基于深度卷积神经网络的动物图像分类方法。项目采用迁移学习技术,通过TensorFlow框架实现高精度动物识别系统,可分类10种动物。研究克服了动物外观多样性、图像质量差异等挑战,特别关注技术伦理问题。实验使用包含24,000余张图像的数据集,采用数据增强、批归一化等技术优化模型性能。开发过程中强调结果复现性,通过设置随机种子确保实验可靠性。该系统在野生动物保护、农业监测等领域具有应用潜力,同时要求开发者兼顾数据隐私和动物福利等伦理考量。
2025-11-17 16:44:38
1104
1
原创 C++20协程:从“回调地狱“到优雅异步——现代C++的范式革命
C++20协程彻底革新了异步编程范式,通过编译器生成的状态机机制,将原本复杂的异步代码转换为类似同步的直观形式。本文从实际项目重构案例出发,对比了传统多线程、回调和状态机方案的局限性,详细解析了协程三大关键字co_await、co_return和co_yield的工作原理,并深入剖析了协程内部机制(协程帧、promise类型和awaitable对象)。文章还演示了如何实现一个完整的Task模板类,以及如何构建支持co_await的异步操作。最后通过生成器示例,展示了协程如何简化数据流处理。这些特性使C++2
2025-11-10 16:41:47
1202
原创 loan预测 EDA-XGBoost
本文介绍了一个完整的贷款偿还预测分析流程。研究基于训练集(train.csv)和测试集(test.csv)数据,以及一个包含20,000条记录的额外数据集(loan_dataset_20000.csv)进行特征工程。分析流程包括: 数据准备:加载并合并三个数据集,识别目标变量(loan_paid_back)和分类特征。 探索性分析:通过皮尔逊相关系数分析数值特征与目标变量的关系,使用克莱姆V值评估分类变量的关联性。结果显示债务收入比(-0.34)和就业状态(0.66)与还款情况关联最强。 特征工程:从外部数
2025-11-10 10:00:17
630
原创 基于YOLO 11的人类骨骼骨折检测
文章摘要:本文展示了一个基于YOLO模型的人体骨骼骨折检测项目的数据准备过程。数据集包含训练集、验证集和测试集,共10种骨折类型分类。通过Python代码实现了数据目录结构展示、YAML配置文件解析,并可视化展示了数据集中的样本图像,包括训练集、测试集和验证集的随机采样图像示例。使用的技术栈包括Numpy、Pandas、OpenCV和Ultralytics等库,为后续骨折检测模型训练奠定了基础。
2025-11-07 17:44:20
375
原创 Go语言并发编程完全指南-进阶版
Go语言并发编程完全指南 摘要 本文全面介绍了Go语言的并发编程特性,从并发基础概念到高级模式,涵盖以下核心内容: 并发模型:Go采用CSP模型,强调"通过通信共享内存"而非传统的共享内存方式 Goroutine:轻量级线程的创建、生命周期管理和调度机制 Channel:类型安全的通信管道,支持缓冲、单向和关闭操作 同步原语:包括互斥锁、读写锁、WaitGroup和条件变量等 高级模式:如select多路复用、context取消传播、定时器管理和协程池实现 核心特点 提供简单易用的gor
2025-11-07 10:44:44
665
原创 Go语言完全学习指南 - 从基础到精通------语言基础篇
《Go语言完全学习指南》摘要:本文全面介绍Go语言从基础到精通的核心知识点,包含19个关键章节。主要内容包括:1.程序结构与包组织;2.命名规范与可见性规则;3.变量常量声明方式;4.基本数据类型与运算符;5.结构体、数组切片和Map的使用;6.控制结构与错误处理;7.指针、函数、方法与接口实现;8.依赖管理与编码规范。通过标准代码示例讲解Go语言特性,如init/main函数、defer机制和异常捕获,同时提供最佳实践建议,适合不同层次的Go开发者学习参考。
2025-11-04 11:22:54
711
原创 糖尿病预测多个机器学习维度预测
本研究基于皮马印第安女性糖尿病数据集,通过多种机器学习方法构建糖尿病预测模型。数据集包含怀孕次数、血糖、血压、BMI等8项指标和糖尿病诊断结果。研究包括数据预处理、特征工程,并比较了逻辑回归、随机森林、决策树、KNN、SVM、AdaBoost、梯度提升和XGBoost等算法的表现。通过超参数调优提升模型性能,最终筛选出最优预测模型,为糖尿病早期诊断提供支持。未来可考虑增加样本量、优化特征选择或尝试深度学习等方法进一步提升模型效果。
2025-11-03 17:49:50
1486
原创 生活方式与肥胖风险:多维度数据分析与预测模型研究
本研究基于20,758份个体数据,探索肥胖水平与多种因素的关系。数据分析显示:肥胖类型III占比最高(19.5%),其次为II型(15.6%);女性样本略多于男性;常见影响因素包括饮食频率(CAEC-有时占比84.5%)和交通方式(公共交通占80.4%)。数据无缺失值,但需修正目标变量拼写问题("0rmal_Weight"应改为"Normal_Weight")。研究将为肥胖预防提供数据支持,包括关键因素识别、预测模型构建及针对性建议制定。
2025-11-03 11:24:43
657
原创 预测海啸:深入探索地震模式(2001-2022年)
🌊 海啸预测研究摘要(2001-2022) 本研究利用2001-2022年全球782次重大地震数据,开发机器学习模型预测海啸发生可能性。数据集包含13个地震特征(震级、深度、位置等),38.9%样本引发海啸。通过探索性分析发现: 震级≥7.5的地震海啸风险显著增加 浅源地震(深度<30km)更易引发海啸 环太平洋"火环带"为高风险区域 采用随机森林、XGBoost等算法,最优模型AUC达0.91,召回率0.85。研究发现地震矩震级(Mw)和震源深度是最具预测力的特征。该成果可为海
2025-11-01 15:01:39
858
原创 用于糖尿病视网膜病变图像生成的GAN
本文介绍了一个基于TensorFlow构建的生成对抗网络(GAN)模型,用于生成糖尿病视网膜病变(DR)图像。该模型采用ResNet架构的生成器和鉴别器,使用128×128×3尺寸的DR图像数据集进行训练,包含5个不同严重程度的病变类别。文章详细描述了数据处理流程、GAN网络架构设计、损失函数与优化器选择,以及训练过程的实现方法。模型通过对抗训练优化生成器和鉴别器,最终可生成逼真的DR图像。该研究为医学图像生成提供了新的技术方案,可用于扩充医疗数据集或辅助临床研究。
2025-10-31 16:04:00
1122
原创 客户消费行为与偏好全景分析报告
完整代码以及数据来源通过对客户购物行为数据进行多维度分析,旨在深入理解消费者画像特征、产品偏好、购买习惯及支付方式等关键因素,挖掘不同用户群体的行为差异与潜在规律。最终为精准营销策略制定、产品品类优化、库存管理以及用户忠诚度提升提供数据驱动的决策支持,进一步提升客户体验与商业效益。字段说明:输出:通过info()可以看出:1.数据中没有缺失值,不需要对其进行操作2.客户唯一标识符数据类型为int整型,需要将其更改为object输出:3.2 重复值输出:显然,查找的重复值数量为0,并没有
2025-10-16 19:36:39
1211
原创 使用LSTM进行人类活动识别
正如这篇文章所解释的,RNN接受多个输入向量进行处理并输出其他向量。可以大致想象成下图所示,想象每个矩形具有矢量深度以及下图中其他特殊的隐藏特性。在我们的例子中,使用了"多对一"架构:我们接受特征向量的时间序列(每个时间步一个向量)将其转换为输出端的概率向量以进行分类。请注意,"一对一"架构将是标准的前馈神经网络。了解更多关于RNN的信息LSTM是一种改进的RNN。它更复杂,但更容易训练,避免了所谓的梯度消失问题。我推荐您学习这个课程以了解更多关于LSTM的知识。了解更多关于LSTM的信息。
2025-10-14 19:46:25
934
原创 奶茶销售数据分析
本项目针对奶茶店销售数据进行分析,使用Python进行数据清洗、异常值处理和可视化。数据集包含3000条记录,涉及日期、星期、商品、天气、促销等9个特征。分析发现151条异常记录(销量与销售额不符),通过公式修正了销量值。项目采用机器学习方法(线性回归、决策树、随机森林等)预测销量,并使用交叉验证评估模型性能。通过数据可视化和特征工程,探索了不同因素(如天气、周末、促销)对销量的影响。最终目标是建立销量预测模型,为奶茶店经营决策提供数据支持。
2025-10-13 16:04:28
806
2
原创 深入理解 Goroutine 调度策略:Go 语言并发的核心机制
Go语言Goroutine调度机制解析 摘要:Go语言通过独特的Goroutine调度器实现了高效的并发编程。本文深入解析了Go调度器的GMP模型(Goroutine、Processor、Machine)及其核心调度策略,包括本地队列优先、工作窃取、移交机制和抢占式调度等关键技术。文章还探讨了网络I/O、系统调用等特殊场景的调度优化,并提供了性能调优建议。Go 1.14引入的基于信号的异步抢占机制解决了紧密循环无法抢占的问题,使调度更加公平高效。了解这些机制有助于开发者编写更优的并发代码,避免Gorouti
2025-10-09 13:50:07
851
原创 Go语言GPM调度器详解:从原理到实践
Go语言GPM调度器原理与实践解析 Go语言通过GPM调度模型实现高效并发,其中G代表协程(Goroutine),P代表处理器(Processor),M代表系统线程(Machine)。这种模型解决了传统线程的三大问题:全局锁竞争、线程切换开销大和内存占用高。GPM采用工作窃取(Work Stealing)机制平衡负载,当P空闲时会从其他P的本地队列"偷取"任务。系统调用处理时,P会与阻塞的M解绑,寻找空闲M继续执行。实战中可通过runtime包观察GPM行为,如调整GOMAXPROCS控
2025-10-09 11:53:19
1050
原创 用 Go 从零实现一个简易负载均衡器
把用户的请求合理地分配到多台后端服务器,从而避免某一台服务器过载,提高系统整体性能和可用性。轮询 (Round Robin):请求依次分发到不同服务器,像轮流排队。随机 (Random):每次随机挑选一台服务器。最少连接数 (Least Connections):优先选择当前连接最少的服务器。在实际生产中,Nginx、HAProxy 等软件会结合更多特性(健康检查、权重、会话保持等)。但我们今天的目标是写一个能跑起来的简易版本。
2025-08-22 10:36:48
807
原创 EEMD-LSTM模型择时策略 --- 1.EEMD分解与LSTM模型搭建
本文提出了一种结合EEMD分解和LSTM神经网络的股票价格预测方法。首先将开盘价和收盘价分别进行EEMD分解,每组数据分解为6个IMF分量(包括2个残差项、2个周期项和2个趋势项)。然后构建6个双层LSTM模型(每层50个神经元),输入为滞后7天的分解IMF分量,输出为下一天的收盘价预测值。数据分为训练集(前2717条)、验证集(中间200条)和测试集(最后562条)。该方法通过EEMD分解提取不同尺度的特征信息,利用LSTM捕捉长期依赖关系,最终将各IMF预测结果求和得到收盘价预测值。实验结果表明,该方法
2025-08-21 15:36:11
674
原创 国际超市电商销售数据分析
超市销售数据分析摘要 本项目从人、货、场三个维度对某国际大型超市的销售数据进行深入分析,旨在优化营销策略。分析发现: 客户维度:Consumer类客户贡献最大利润(48.7%),其中Technology类产品(如Phones和Copiers)利润占比最高; 产品维度:科技产品利润突出,但家具类部分产品(如Tables)出现亏损; 区域维度:结合帕累托法则,识别出20%的高价值客户贡献80%利润。 建议:聚焦高利润客户群体,优化亏损产品组合,并利用BI工具(如Tableau)提升多维度分析效率。 (字数:15
2025-08-21 15:34:41
615
原创 脱发因素可视化分析及机器学习预测
该研究分析了可能导致脱发的多种因素数据集,包括遗传、荷尔蒙变化、医疗状况等12个特征。通过数据预处理和可视化分析发现:1) 样本中脱发比例为49.7%;2) 脱发人群年龄分布较广;3) 斑秃、甲状腺问题和头皮感染是前三大脱发相关医疗状况。研究采用随机森林等算法建立预测模型,为脱发风险识别提供数据支持。
2025-08-21 15:33:43
1171
原创 2025全球库存动态追踪系统
本文通过对全球产品库存数据进行处理、分析与可视化,探索产品生命周期、库存分布及品类特征。研究内容包括数据清洗(处理日期字段、拆分尺寸规格)、描述性分析(价格/库存/评分的分布特征)以及多维可视化(品类价格箱线图、库存热力图、生命周期直方图等)。结果显示产品价格差异显著(10-499元),库存波动较大(1-100件),不同品类在评分、尺寸和库存分布上存在明显差异。最后通过聚类分析揭示产品特性间的潜在关联,为库存优化提供数据支持。
2025-05-30 11:30:21
968
原创 适合各个层次的 7 个计算机视觉项目【1】:植物病害检测
植物病害检测是计算机视觉在农业领域的一个重要应用。您将学习如何加载、处理和扩充数据集,构建深度神经网络模型,并在数据集上训练模型。该项目有助于理解图像分类,并通过实现早期病害检测为可持续农业做出贡献。.4f。
2025-03-25 19:59:08
316
原创 电商产品评论数据情感分析
针对用户在电商平台上留下的评论数据,对其进行分词、词性标注和去除停用词等文本预处理。基于预处理后的数据进行情感分析,并使用LDA主题模型提取评论关键信息,以了解用户的需求、意见、购买原因及产品的优缺点等,最终提出改善产品的建议一些电商平台为了避免一些客户长时间不进行评论,往往会设置一道程序,如果用户超过规定的时间仍然没有做出评论,系统就会自动替客户做出评论,这类数据显然没有任何分析价值。由语言的特点可知,在大多数情况下,不同购买者之间的有价值的评论是不会出现完全重复的,如果不同购物者的评论完全重复,那么这些
2025-03-20 20:06:29
1464
原创 基于CNN的多种类蝴蝶图像分类
这次这个基于cnn的图像分类,获得了高于 70% 的准确率。可以加载我保存好的模型进行预测试试,感兴趣的还可以继续调参训练# 若需要完整数据集以及代码请点击以下链接。
2025-03-17 20:17:34
667
原创 基于深度卷积神经网络的水果蔬菜图片分类预测
本次主要使用的为深度卷积神经网络,对36种水果蔬菜图片进行模型训练,预测可视化等首先对数据集进行分析查看,数据集包含2个G的图片,包含3个文件夹,分为训练集、测试集、验证集其次对数据集图像进行预处理,具体使用为图像增强接下来使用增强后的数据集对深度卷积神经网络模型进行训练,卷积神经网络对多分类图像处理还是比较强的最后使用训练的模型使用测试集进行预测评估,随机选取图像可视化结果并展示。
2025-03-17 14:03:35
612
原创 跨模态智能脑肿瘤检测
脑肿瘤的早期检测和诊断对患者的治疗效果至关重要。随着医疗成像技术的进步,**计算机断层扫描(CT)和磁共振成像(MRI)**已成为最常用的脑部影像学检查方法。这些成像技术能够提供关于脑部结构和病变的关键信息,帮助医生准确地诊断肿瘤类型和位置。然而,传统的人工诊断依赖医生的经验,且常常受到主观因素的影响,特别是在复杂或早期的肿瘤案例中,准确性和效率可能受到限制。因此,利用机器学习和深度学习技术对这些医学图像进行自动化分析,成为近年来医学影像领域的一个重要研究方向。
2025-03-14 18:13:25
813
2
原创 基于Attention U-Net与SAR影像的滑坡识别
Dice 系数常用于评估图像分割任务中预测结果与真实标签的相似度,取值范围在 0 到 1 之间,越接近 1 表示预测结果与真实标签越相似。而 Dice 损失函数则是基于 Dice 系数定义的,用于在训练模型时作为优化目标,使得模型在训练过程中不断减小该损失值,从而提高预测的准确性。smooth = 1#Dice 系数#Dice 损失函数精确率关注预测的准确性,召回率关注对正例的捕捉能力,F分数综合了两者,交并比则直观地反映了预测区域和真实区域的重合程度。
2025-03-14 16:39:18
719
原创 某快餐店用户市场数据挖掘与可视化
从年龄均值来看,簇 0 的顾客相对年轻,平均年龄约为 31 岁,而簇 1 的顾客平均年龄约为 56 岁,两者存在明显的年龄差异。在喜欢程度方面,两个簇的均值都比较高且较为接近,不过簇 1 的喜欢程度均值略高于簇 0,这可能暗示年龄较大的顾客对相关事物的喜欢程度稍高一些,但差异并不是非常显著。
2025-03-12 14:38:07
1082
原创 搭建VGG16模型实现新冠肺炎CT图像识别
笔者在这里选择通过继承nn.Module的方式来构建神经网络;在正式构建模型以前,我们先升级一下pip和安装torchsummary!!# 导入torchsummary from torchsummary import summary大家可以参考以下这张图片,根据卷积核大小和卷积层数目的不同,VGG可以分为以下6种子模型,笔者在这里选择手动构建一个VGG-16 D模型。# 定义神经网络模型(VGG-16)# 第一层:2个卷积层和1个池化层# 输入3通道,输出64通道。
2025-02-28 11:21:56
490
原创 基于U-Net与EfficientNet的衣物智能分割
在深度学习中,数据预处理和数据增强是提高模型泛化能力的关键步骤。本部分展示了如何为服装图像分割任务准备训练数据和验证数据,并应用不同的数据增强技术,以增强模型对不同情况的适应性。通过将数据集进行随机裁剪、水平翻转、平移、缩放和旋转等增强操作,模型能够学习到更多的图像变换特征,提高其在实际应用中的表现。我们首先定义了MyDataset类,继承自PyTorch的Dataset类,实现了自定义的数据集加载与处理。
2025-02-27 15:16:26
1250
原创 基于数据技术的互联网行业招聘信息聚合系统
基于数据技术的互联网行业招聘信息聚合系统本系统以Python为核心,依托web展示,所有功能在网页就可以完成操作,爬虫、分析、可视化、互动独立成模块,互通有无。具体依托python的丰富库实现,爬虫使用Requests爬取,使用lxml、beautifulsoup4解析。使用numpy、pandas分析数据,使用pyecharts做可视化,使用Flask进行web后台建设。数据通过csv、MySQL、配置文件来进行存储互通。
2025-02-27 09:42:22
346
基于Vue和Gin的全栈开发平台,快速上手、功能丰富
2024-12-27
120年奥运历史数据集:运动员和成绩
2023-03-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅