一、这个数据集对应的产品与国内哪款产品类似?
该数据集与各大在线教育企业官网选课界面中K12模块的内容相似,具体产品如:“学而思网校”、“新东方”等。
二、数据集
数据来源地址:通过某爬虫工具爬取沪江网校中小幼教育培训班官网数据。网页地址如下:
中小幼教育培训班_在线中小幼教育学习辅导班_中小幼教育培训价格-沪江网校
数据集大小及特征:该数据集经简单清洗后,共计13个字段,492行,具体如下:
ID:编号 ;标题;学科名称;年级/阶段;课程描述;课程状态;有效期;课时数;现价;老师姓名;老师数量;原价格;优惠
三、想从该数据集中得到的描述统计信息
1、课程现价、优惠:均值、中位数、最大值、最小值、四分位数、方差
2、课程有效期及课时数:均值、中位数、最大值、最小值、四分位数、方差
3、在年级维度上,各年级不同学科的占比情况
4、总体学科占比,总体年级占比情况
四、想从该数据集中分析哪几个业务问题以及哪些字段有价值?
业务问题:
1、该数据集中的课程价格如何?(初步了解在线课程的市场行情)
2、同一年级的同科目课程,价格是否有差异?影响价格的因素有哪些?
3、课程的有效期是否与课时数有相关性?
4、哪些科目的课程多?哪个年级的课程多?(科目及年级的集中趋势如何?)
5、课程状态以及是否是一个老师全程授课?
有价值的字段:
学科名称;年级/阶段;课程状态;有效期;课时数;现价;老师姓名;老师数量;原价格;优惠