数据挖掘
文章平均质量分 81
喜东东cc
分享为主
展开
-
《应用商务统计分析》第八章 自回归
一、目的二、数据来源和相关说明1、数据来源2、数据信息3、变量信息三、描述性分析1、描述统计2、单因素分析四、数据建模1、全模型分析2、模型选择3、模型预测和评估五、总结...原创 2021-05-21 20:17:09 · 757 阅读 · 0 评论 -
《应用商务统计分析》第七章 生存分析模型
一、目的医生在诊断骨髓癌这种致命疾病时,常常需要做一个判断,即病人还能生存多长时间,或者哪些因素影响着病人的生存时间。合理回答该问题对医生和相关研究者的帮助甚大。基于对该问题的正确回答,医生能够给病人制定更合理的治疗方案,研究者可以对相关课题进行更为精确的研究。本报告试图通过对相关临床数据的分析找出影响患者生存时间的因素,并根据分析结果提出有意义的结论和建议。二、数据来源和相关说明1、数据来源来源于Krall、Uthoff、Harley收集的关于骨髓癌患者的生存数据。import o.原创 2021-05-11 10:28:30 · 1797 阅读 · 0 评论 -
《应用商务统计分析》第六章 泊松回归
一、目的从超市会员消费记录中找出规律,并判断会员次月光顾超市的次数。二、数据来源和相关说明1、数据来源来源于某家超市部分会员的详细消费记录。import osimport numpy as npimport pandas as pdfrom matplotlib import pyplot as plt# 参数设置plt.rcParams['font.sans-serif']=['SimHei'] #中文plt.rcParams['axes.unicode_minus']原创 2021-05-06 10:20:14 · 1230 阅读 · 3 评论 -
《应用商务统计分析》第五章 定序回归
一、目的1、对手机的某些功能在不同的功能组合中所起的作用的分析;2、找出哪些因素在影响消费者对手机的偏好程度,以及其影响程度。二、数据来源和相关说明1、数据来源对不同款手机的偏好程度调查(来自北京大学光华管理学院的MBA学生和高级经理培训班的学员)。df_raw = pd.read_csv(open(os.path.join(filePath, fileName)))2、数据信息1451条样本,8个变量。print(df_raw.shape)3、变量信息(1原创 2021-04-29 15:05:09 · 1978 阅读 · 0 评论 -
《应用商务统计分析》第四章 0-1变量的回归模型
目录一、目的二、数据来源和相关说明三、描述性分析四、数据建模五、总结# import相关包import osimport numpy as npimport pandas as pdfrom matplotlib import pyplot as pltimport statsmodels.api as smimport statsmodels.formula.api as smf from scipy.stats import chi2from sklearn原创 2021-03-10 15:38:12 · 4609 阅读 · 0 评论 -
《应用商务统计分析》第三章 协方差分析
本章意在通过教学评估数据分析的案例,介绍协方差分析统计回归模型的原理和应用。一、目的(1)找出影响最终教学评估成绩的因素;(2)提出一个合理的绩效考核标准;二、数据来源和相关说明(1)数据来源:北京大学光华管理学院的教学评估记录(2)数据信息:时间范围:2002~2004年数据量:340(3)变量信息自变量 自变量/解释性变量:教员职称/title:助理教授、副教授、正教授教员性别/gender:女、男...原创 2021-01-25 17:45:13 · 782 阅读 · 0 评论 -
【机器学习】回归树
【参考】1.机器学习算法—Regression Tree 回归树:https://juejin.im/post/5a7eb1f06fb9a0636108710a2.回归树(Regression Tree):https://www.cnblogs.com/wuliytTaotao/p/10724118.html3.GBDT(MART) 迭代决策树入门教程 | 简介:https://blo...转载 2019-07-19 09:49:17 · 178 阅读 · 0 评论 -
【机器学习】为什么随机分类时,AUC = 0.5?
关于ROC和AUC的介绍,可以参考维基百科。这里仅谈个人对随机分类下ROC曲线的理解,即为什么随机分类时,AUC = 0.5?若理解有误,恳请大佬指导↖(^ω^)↗一、混淆矩阵:二、ROC曲线:横坐标:FPR = b1 / ( b1 + b2 ) = 预测为正,实际为负 /总负样本数 =负样本预测错误数 / 总负样本数纵坐标:TPR = a1 / ( a...原创 2019-01-03 14:21:31 · 13195 阅读 · 3 评论 -
【机器学习】时序数据处理
相关参考文献:1.时间序列交叉验证2.机器学习与时间序列预测3.时序数据预测案例: O2O Coupon Usage Forecast4.时间序列模型中样本时间窗口的选择-华泰期货5.scikit-learn交叉验证时间序列数据的自定义拆分6.Feature Selection for Time Series Forecasting with Python 一、背景...原创 2018-12-26 11:29:21 · 5698 阅读 · 0 评论 -
【Tensorflow】Inception-v3 迁移学习
数据集下载:经典的cat数据 inception-v3下载:classify_image_graph_def.pb 一、注意事项创建sess时启动inception-v3: tf.Session(graph=graph);最后一层全连接层的输入使用tf.placeholder_with_default()占位,而不是tf.placeholder();训练时记得保存labels.tx...原创 2018-07-25 11:30:57 · 710 阅读 · 0 评论 -
【Tensorflow】mnist_with_summaries.py报错
最近在学tensorflow,以官网教程为入门资料,刚好学到tensorboard(以mnist手写识别码为例),但是在运行的过程中,却一直报错,本人小白,花了一段时间去解决,所以将错误记录下来,与大家分享。 一、InvalidArgumentError 问题:没有传入x,yInvalidArgumentError: You must feed a value for placehol...原创 2018-07-16 14:39:36 · 416 阅读 · 0 评论 -
【机器学习】神经网络
1.从机器学习谈起 2.神经网络浅讲:从神经元到深度学习转载 2018-06-15 14:32:21 · 164 阅读 · 0 评论 -
《应用商务统计分析》前言
一、背景前段时间偶然读到《应用商务统计分析》,市面上的此类书,大多数通过生硬的语言阐述统计学理论,而此书不同,它从案例的角度出发,将整个统计分析的流程串了起来,热情的为初学者敞开统计学大门。为了让理解更深刻,决定将本书中的案例复现。二、书籍简介《应用商务统计分析》是以实际案例驱动的应用统计学教材,包括线性回归、方差分析、协方差分析、0-1变量回归、定序回归、泊松回归、生存模型...原创 2019-05-20 17:17:15 · 883 阅读 · 0 评论 -
《应用商务统计分析》第一章 线性回归(报告)
说明:本报告仅供学习参考,不代表任何投资建议。同时欢迎各位大佬指点交流~报告地址:因为博客里面的编辑界面不太友好(本人懒),所以将报告上传至了github;...原创 2019-06-04 11:21:31 · 684 阅读 · 0 评论 -
《应用商务统计分析》第一章 线性回归(代码)
上市公司净资产收益率预测分析(github地址)一、流程1. 数据采集确认采样信息,包括自变量和因变量、时间范围、数据来源(优矿平台)。import pandas as pdimport numpy as npimport randomimport matplotlib as mplimport matplotlib.pyplot as pltimport sea...原创 2019-05-29 18:38:17 · 1053 阅读 · 1 评论 -
《应用商务统计分析》第二章 方差分析(报告)
说明:本报告仅供学习娱乐,不代表任何实操建议。同时欢迎各位大佬指点交流~报告地址:因为博客里面的编辑界面不太友好(本人懒),所以将报告上传至了github;...原创 2019-07-03 18:23:24 · 449 阅读 · 0 评论 -
《应用商务统计分析》第二章 方差分析(代码)
广州市商品房价格影响因素分析报告一、数据采集链家网房价数据爬虫(github)二、分析流程(github)0.参数设置import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport statsmodels.api as smfrom statsmodels.formula....原创 2019-07-03 18:44:23 · 563 阅读 · 0 评论