小雨。这个雨要下到什么时候...
又是第二天挖坑,可是调试一半的代码真的是放不下。F项目的alpha版本已提交,但是浑身BUG...
晚上的网易笔试感觉质量很不错。但是我没来得及写最后一题,可能更习惯用话来讲述,当然前面的28道选择真的是花了好多时间。主观题的字数也码得太少了,看有没有机会面试吧。一切顺其自然。
吐槽老姐真的是处理事情太复杂。
明天继续把F的一些可以修改的BUG改一下,另外和服务器对接。
Target 003:时长<3天> ,内容<F项目完善,简历完善>
回答一下最后一个数据分析题吧。
T: 2016考研培训的人数调查。 Q: 方法的交叉验证,要收集的数据。暂时想起前两个问题。
调查的方法,我设想是一个线上的问卷。这个要考虑问卷的投放方式,对象(如何找到你要的目标人群),问卷内容设计(其实也是第二问中要收集的哪些数据)。所以在考研机构的网站上投放是一种,另外利用社交圈子进行传播(可带有一定性质奖励)。对象就是准备2016考研的人。
第二种,线下的数据收集,不直接与考研的人收集,而是通过院校统计,得到数据。
收集的数据包括,目标的基本信息,院校信息,专业类别,所属地区,家庭情况(经济,人口),选择的机构等
那么交叉验证这一步,可以通过网上得到的“院校考研培训与考研人数比” ,“不同评级的院校间的考研培训与考研人数比” ,“考研和不考研比例”和院校的数据进行比对。
可以得到的数据包括,以上两个,还有选择考研培训的地区占比,选择培训的专业占比。结合5个比率,通过全国的高校人数,高校的人数占比(985,211,一本,二本,私立分类)可以得到一个数据S1,高校的专业人数占比得到人数S2,地区占比得到S3。然后可以进行加权平均。加权依据应该是交叉验证时候,得到的数据准确度来评价。