- 博客(16)
- 收藏
- 关注
原创 Python实现12种概率分布
Python实现12种概率分布Beta 分布Beta 分布(连续型)高斯分布/正态分布(连续型)标准正态分布范畴分布多项式分布(离散型)二项分布(离散型)伯努利分布指数分布 狄利克雷分布(连续型)Gamma 分布(连续型) 学生 t-分布
2023-03-19 22:05:59
612
原创 R语言实现青少年市场细分(数据科学导引)
随着推特和微信等社交网络平台的流行,越来越多的青少年用户会在这些平台发布信息。这些数据能够反映青少年的行为兴趣,结合平台上用户的性别、年龄等信息,对于挖掘青少年细分市场具有很大价值。
2023-03-19 21:16:07
624
1
原创 R语言实现红酒品质的分类(数据科学导引)
当今时代,社会飞速发展,人民生活越来越富裕,红酒开始逐渐登上人们的餐桌。随着红酒产业酿造技术的革新,红酒在生产工艺上取得了显著地进步,大大降低了生产成本,红酒市场也逐步扩大。目前,红酒的品质主要依靠红酒师的品尝来判定,主观因素强且效率低,难以满足市场需求。因此,采用机器学习算法实现对红酒品质的自动鉴定具有很高的实际应用价值。
2023-02-24 18:32:41
1071
原创 R语言实现个人信用风险评估(数据科学导引)
在很多国家,政府机构会密切监控贷款业务银行需要明确解释申请者的贷款申请被拒绝或者批准的原因。这种可解释性对于贷款申请者也是很重要的,在贷款申请被银行拒绝时,申请者需要知道为什么自己的信用级别不符合银行的要求.通过构建自动化的信用评分模型,以在线方式进行即时的信贷审批能够为银行节约很多人工成本,数据集47 共有 1000个贷款样本,每个样本包含20 个相关特征和 1个表示贷款是否违约的特征“default” 。
2023-02-24 18:28:46
566
原创 R语言实现光学字符识别(数据科学导引)
光学字符识别:光学字符识别(Optical Character Recognition, OCR)是指扫描仪等电子设备通过检测暗、亮的模式确定字符形状, 并使用字符识别方法将形状翻译成计算机字符的过程. 如何除错或利用辅助信息提高识别正确率, 是OCR最重要的课题, OCR技术的发展对于信息自动化和办公自动化的普及具有极大的推动作用. 此案例所给数据集共有26 个英文大写字母的20000个样本, 每一个样本代表光学图像中的一个矩形区域. 该区域只包含单个字符, 每个样本包含16 个输入特征和目标特征”
2023-02-16 17:55:41
294
原创 R语言实现医疗费用预测(数据科学导引)
医疗费用预测:保险公司通常需要募集比花费在受益者的医疗服务上更多的年度保费。因此,精确预测医疗费用对保险公司具有重要价值。本文方法:观察变量间关系,建立线性回归模型,评估模型性能后进行改进,如添加非线性关系和考虑特征之间的相互影响等,得到改进的回归模型来进行预测。
2023-02-16 17:46:10
394
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人