自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 基于SEAL链路预测应用:城市节点病毒传播预测(毕业设计+算法优化+完整代码)

PyTorch非常适合用于构建深度神经网络。提供了高级API来构建各种模型,包括卷积神经网络、循环神经网络和变换器模型等。SEAL是一种新的链路预测框架,它将链路预测系统地转化为子图分类问题。

2023-10-14 23:16:13 932 3

原创 读书笔记——《原因与结果的经济学》

①是否“纯属巧合”?出现伪相关探讨实际情况②是否存在“第三变量”?相关关系不等于因果关系混杂因素进行干扰③是否存在“逆向因果关系”?质疑原因与结果的方向是否相反。

2023-09-15 09:42:37 184

原创 商业数据挖掘Part4——数据集的构造+Xgboost模型设计

【代码】商业数据挖掘Part4——数据集构造 Xgboost模型。

2023-08-28 12:23:36 164 1

原创 商业数据挖掘Part3——特征工程+特征构造

获取基本的用户特征,基于用户本身属性多为类别特征的特点,对age,sex,usr_lv_cd进行独热编码操作,对于用户注册时间暂时不处理。在上面针对用户进行累积特征提取的基础上,分别提取用户近一个月、近三天的特征,然后提取一个月内用户除去最近三天的行为占据一个月的行为的比重。根据商品文件获取基本的特征,针对属性a1,a2,a3进行独热编码,商品类别和品牌直接作为特征。分时间段下各个商品类别的。

2023-08-28 00:15:48 188 1

原创 商业数据挖掘Part2——用户特征表单+商品特征表单+数据清洗+购买因素分析

由上述统计信息发现: 第一行中根据User_id统计发现有105321个用户,发现有3个用户没有age,sex字段,而且根据浏览、加购、删购、购买等记录却只有105180条记录,说明存在用户无任何交互记录,因此可以删除上述用户。分析: 2月份5,6,7,8,9,10 这几天购买量非常少,原因可能是中国农历春节,快递不营业。同时发现,3,4月份类别8销售记录在前半个月特别相似,除了4月8号,9号和3月15号。分析:2月份对类别8商品的购买普遍偏低,3,4月份普遍偏高,3月15日购买极多。

2023-08-27 23:31:12 169

原创 基于tensorflow框架的基因本体论GO蛋白质embedding的DNN模型

本文介绍了基于深度学习的tensorflow框架的蛋白质预测,使用PCA筛选BPO,MFO,CCO中的多维度影响因素,从而预测蛋白质函数

2023-08-27 20:00:57 294

原创 基于线性回归的商品销售额预测(假日效应、季节性商品处理)

基于线性回归的商品销售额预测(假日效应、季节性商品处理)(一)环境安装及配置(二) 数据EDA2.1 分析存储数据2.2 分析国家数据2.3 产品数据分析2.4 分析新冠病毒的影响2.5分析工作日和周末的数据(三)线性回归(第一轮)3.1 SMAPE指标3.2 模型原理:3.3 整合数据(三) 线性回归(第二轮)(三) 线性回归(第三轮)(三) 线性回归(第四轮)(四) 模型提交(五) 模型预测(一)环境安装及配置“holidays” 是一个Python包,用于处理节假日和工作日的计算和管理。它提供了

2023-08-24 19:06:46 793 1

原创 针对信贷违约风险的LightGBM梯度提升(算法思想+实例+完整代码)

本文主要是介绍了一个完整二元分类的数据预处理和建模流程,它加载各种不同的数据文件,执行特征工程,然后使用LightGBM模型进行k-fold交叉验证的训练和预测。最终,它会生成一个特征重要性的图表,并可以生成提交文件。主要数据表,分为训练集(带有目标变量TARGET)和测试集(不带目标变量TARGET)两个文件。包含所有申请的静态数据。每行代表数据样本中的一笔贷款。bureau.csv包括客户先前在其他金融机构获得的所有信用,这些信用已报告给信用局(适用于我们样本中有贷款的客户)。

2023-08-23 23:52:45 535

原创 市场战略和经营方式模型理论的代码实现(3)

问题的特性总是受到一些因素的影响,我们通过头脑风暴找出这些因素,并将它们与特性值一起,按相互关联性整理而成的层次分明、条理清楚,并标出重要因素的图形就叫特性要因图。因其形状如鱼骨,所以又叫鱼骨图(以下称鱼骨图),它是一种透过现象看本质的分析方法。头脑风暴法(Brain Storming——BS):一种通过集思广益、发挥团体智慧,从各种不同角度找出问题所有原因或构成要素的会议方法。BS有四大原则:严禁批评、自由奔放、多多益善、搭便车。

2023-08-21 13:56:13 332 1

原创 SEAL-DGCNN 链路预测相关的数学公式

为SEAL算法做相关补充

2023-08-21 12:19:18 288 1

原创 企业管理/市场分析模型理论的代码实现(2)

制定公司层战略最流行的方法之一就是BCG矩阵。该方法是由波士顿集团(Boston Consulting Group, BCG)在上世纪 70 年代初开发的。BCG矩阵将组织的每一个战略事业单位(SBUs)标在一种 2 维的矩阵图上,从而显示出哪个SBUs提供高额的潜在收益,以及哪个SBUs是组织资源的漏斗。BCG矩阵的发明者、波士顿公司的创立者布鲁斯认为“公司若要取得成功,就必须拥有增长率和市场分额各不相同的产品组合。组合的构成取决于现金流量的平衡。

2023-08-20 23:16:40 636 1

原创 企业管理/市场分析模型理论的代码实现(1)

本文总结了企业管理和市场分析等9个经典模型,不仅适用于转行的管理新手略知一二,还可以让创新创业的大学生鬼扯更多的模型并锦上添花

2023-08-18 19:08:07 606 1

原创 商业数据挖掘Part1——前言+挖掘流程+数据检查

详细介绍了数据挖掘流程的相关工作,包括数据清洗、数据理解与分析、特征提取和模型建立等环节。在数据清洗阶段,我们验证了数据集的完整性,处理了数据集中的缺失值,并对各特征数值进行了合理处理。如何筛选了有价值的数据信息,并生成了新的数据源,为后续分析和建模提供了基础。在数据理解与分析阶段,深入理解了各个特征的含义,并通过可视化展示对数据进行了观察和分析。在特征提取阶段从原始数据中提取了与预测目标相关的有价值特征,为模型建立奠定了基础。

2023-08-03 17:57:34 267

原创 多模态之情感预测 涉及 BERT, RoBERTa, XLNet, XLM, DistilBERT 架构

Fastai with HuggingFace Transformers 是一个结合了Fastai深度学习库和HuggingFace Transformers库的工具集,旨在简化使用自然语言处理(NLP)中的预训练模型,如BERT、RoBERTa、XLNet、XLM和DistilBERT等。从HuggingFace Transformers中选择适合您任务的预训练模型,并使用Fastai来处理数据、构建模型和进行训练。 这种组合提供了一种简便而高效的方式来开展NLP研究和应用开发。

2023-07-15 16:14:23 516 2

原创 在 COCO数据集上训练 YOLOX (代码详解)

讲解了YOLOX项目的代码细节,数据集为COCO

2023-06-05 14:42:44 1557 1

原创 数据集交叉验证方式

简单的介绍了常用的交叉验证方式

2023-06-05 10:59:47 537 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除