【数据分析】业务分析中常见模型-波士顿矩阵、逻辑回归模型

1 .逻辑回归模型:个性化推荐系统
个性化推荐系统是充分根据用户历史行为、地理位置、社交关系等推荐一些用户想要的个性化结果。
推荐的核心问题是如何发现用户对潜在商品的偏好,在用户没有明确意图的情况下,帮助用户发现自己偏好的商品。
个性化推荐系统在互联网行业非常普遍:比如音乐推荐、电影推荐、性化阅读推荐、社交网络好友推荐、朋友圈推荐以及基于位置的服务推荐等。
据统计,Netflix有60%多的电影因推荐而被观看,Google News因推荐提升40%的点击率,亚马逊因推荐被购买的销售占比高达38%。
在这里插入图片描述
1.1 常见的个性化推荐模型

  • 基于关联规则的推荐 (user-item)
    基于关联规则的推荐的前提是用户已经购买了某个商品,然后根据用户已购买商品和其他商品之间的相关性做出推荐。关联规则的建立是采用概率统计的方式来判断某两种或者多种商品之间的相关性有多大。
  • 协同过滤推荐
    协同过滤推荐是利用最近邻算法得到用户和用户,物品和物品的相似程度而产生推荐结果。
    ● 用户和用户(user-user):只要找出相似用户喜欢的物品,并预测目标用户对对应物品的评分,就可以找到评分最高的若干个物品推荐给用户。
    ● 物品和物品(item-item):只要找到了目标用户对某些物品的评分,那么我们就可以对相似度高的类似物品进行预测,将评分最高的若干个相似物品推荐给用户。
  • 逻辑回归模型
  • 逻辑回归(Logistic Regression)是一种用于解决二分类(0 或1)问题的统计学模型,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。
  • 通过逻辑回归,可以得到某用户购买某品牌的可能性,最终按照这个可能性排序来取top-k进行推荐
  • 逻辑回归模型的实现
    1.将用户年龄、性别、物品属性、物品描述、当前时间、当前地点等特征转换成数值型特征向量
    2.确定逻辑回归模型的优化目标(以优化点击率为例),利用已有样本数据对逻辑回归模型进行训练,确定逻辑回归模型的内部参数
    3.在模型服务阶段,将特征向量输入逻辑回归模型,经过逻辑回归模型的推断,得到用户“点击”物品的概率
    4.利用“点击概率”对所有候选物品进行排序,得到推荐列表

2.波士顿矩阵模型:产品定位
波士顿矩阵(BCG Matrix) 又称市场增长率—相对市场份额矩阵、波士顿咨询集团法、四象限分析法、产品系列结构管理法等。

波士顿矩阵采用销售增长率市场占有率两个指标来衡量产品。销售增长率与市场占有率既相互影响,又互为条件。
通过以上两个因素相互作用,会出现四种不同性质的产品类型,形成
不同的产品发展前景:
● 销售增长率和市场占有率“双高”的产品群(明星类产品)
● 销售增长率和市场占有率“双低”的产品群(瘦狗类产品)
● 销售增长率高、市场占有率低的产品群(问号类产品)
● 销售增长率低、市场占有率高的产品群(现金牛类产品)
在这里插入图片描述
2.1 波士顿矩阵模型的分析思路

  • 明星产品:
    高增长且高市场占有率,发展前景好,竞争力强,需加大投资以支持其发展;
  • 现金牛产品:
    低增长但高市场占有率,成熟市场的领导者,应降低投资,维持市场占有率并延缓衰退
  • 问题产品:
    高增长但低市场占有率,发展前景好但市场开拓不足,需谨慎投资;
  • 瘦狗类产品:
    低增长且低市场占有率,利润率低甚至亏损,应采取撤退战略。
    在这里插入图片描述
    2.2 波士顿矩阵模型在用户分类中的应用
  • 明星型用户:
    消费次数和客单价均高于平均水平,值得我们重点关注,有针对性的增加运营活动,提高用户的忠诚度
  • 金牛型用户:
    客单价低于平均水平,但是消费频次高,能给企业带来稳定的收益,一般不需要特别关注
  • 问题型用户:
    客单价高于平均水平,但是消费频次低。对于这类用户应当通过推送、邮件、优惠券等活动促进回访,提高消费频次
  • 瘦狗型用户:
    客单价和消费次数均低于平均水平,应当进一步了解用户的痛点,适当采取个性化推荐、搭售等活动提高用户的客单价和消费次数
    在这里插入图片描述
### 关于河南大学逻辑回归实验的相关资源 在查找与河南大学逻辑回归实验相关的报告或资料时,可以参考以下几个方面的内容: #### 1. **逻辑回归的基础理论** 逻辑回归是一种广泛应用于分类问题的统计方法。尽管其名称中有“回归”,但它实际上被用来解决二分类或多分类问题。逻辑回归的核心思想是通过sigmoid函数将线性组合的结果映射到概率空间[^4]。 ```python import numpy as np def sigmoid(z): return 1 / (1 + np.exp(-z)) ``` 上述代码展示了如何定义一个简单的sigmoid函数,这是逻辑回归中的核心部分之一。 --- #### 2. **实验设计与数据准备** 类似于波士顿房价预测的数据处理流程,在逻辑回归实验中也需要对数据进行预处理和特征工程。以下是常见的步骤概述[^3]: - 收集并加载数据集。 - 对数据进行清洗,包括去除缺失值、异常值等。 - 进行特征缩放(标准化或归一化),以便提高模型收敛速度。 - 将数据划分为训练集和测试集。 ```python from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler # 假设X为特征矩阵,y为目标标签 scaler = StandardScaler() X_scaled = scaler.fit_transform(X) X_train, X_test, y_train, y_test = train_test_split( X_scaled, y, test_size=0.2, random_state=42) ``` 以上代码片段演示了如何使用`StandardScaler`对数据进行标准化,并利用`train_test_split`划分训练集和测试集。 --- #### 3. **模型构建与评估** 对于逻辑回归模型的实现,可以选择手动编写梯度下降算法或者直接调用现成的库,如`sklearn`。以下是一个基于`sklearn`的例子: ```python from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score, classification_report model = LogisticRegression(penalty='l2', solver='liblinear') model.fit(X_train, y_train) y_pred = model.predict(X_test) print(f'Accuracy: {accuracy_score(y_test, y_pred)}') print(classification_report(y_test, y_pred)) ``` 此代码实现了带有L2正则化的逻辑回归模型,并打印出了准确率和详细的分类报告。 需要注意的是,选项B提到套索回归的目标函数连续可导但不可解析求解是最优参数的原因在于L1范数引入了非光滑点。 --- #### 4. **实验报告模板建议** 一份完整的实验报告应包含以下几部分内容: - **摘要**:简要描述实验目的、方法及主要结论。 - **背景介绍**:阐述逻辑回归的基本原理及其应用场景。 - **实验环境配置**:说明使用的编程语言、工具包版本及其他依赖条件。 - **数据分析**:展示原始数据概况以及预处理后的变化情况。 - **建模过程**:记录从模型初始化到最后验证的所有操作细节。 - **结果讨论**:对比不同超参数设置下的表现差异,并给出最终推荐方案。 - **总结展望**:归纳本次研究的价值所在,并指出未来改进方向。 --- ####
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值