StudentLife数据集介绍

原网址:https://studentlife.cs.dartmouth.edu/

StudentLife是第一个使用来自达特茅斯大学48名学生的十周感知数据的研究。这些数据是从手机上被动和自动感知的,用来评估他们的心理健康状况(例如,抑郁、孤独、压力)、学习成绩(所有班级的成绩、学期平均绩点和累计平均绩点)以及行为趋势(例如,压力、睡眠、睡眠等),去健身房等。随着学期的进展,一些数据是变化的,如作业、期中考试、期末考试。

学生生活中的许多压力和压力仍然隐藏着。事实上,教师、主任、临床医生在课堂外对学生知之甚少。学生可能知道自己的情况和模式,但对同学知之甚少。为了照亮学生生活,我们开发了第一款StudentLife智能手机应用程序和感应系统,可以自动推断人类行为。

为什么有些学生成绩比其他学生好?在类似的情况下,为什么有些人表现出色,而有些人失败呢?为什么学生精疲力竭,翘课,甚至辍学?压力、负担、睡眠、心情对学习成绩的影响是什么?这项研究使用了我们为智能手机开发的android应用程序,该应用程序由48名学生在10周的学期中携带,以找到这些棘手问题的答案。

我们在手机上使用计算方法和机器学习算法来评估传感器数据,并做出更高层次的推断(即睡眠、社交、活动等)。学生手机上运行的StudentLife应用程序全天候自动测量以下人类行为,无需任何用户交互:
(1)睡觉时间、起床时间和睡眠时间
(2)每天会话的数量和每次会话的持续时间
(3)体育活动(步行、坐、跑、站)
(4)他们的位置和在那里呆了多久(如宿舍、班级、聚会、健身房)
(5)一天中学生周围的人数
(6)室外和室内(校园内)交通
(7)一天、一周和学期的压力水平
(8)正面影响(他们对自己的感觉如何)
(9)饮食习惯(何时何地进食)
(10)应用程序使用
(11)校园和全国性活动的现场评论:抗议活动,取消课程;波士顿爆炸案。

我们使用了一些著名的心理健康前后调查。春季的和累积的平均绩点作为ground truth来评估心理健康和学业成绩。

下面你会发现一些报告了StudentLife数据集发现的论文。因为我们对激发人类行为挖掘的兴趣,我们发布了StudentLife数据集的匿名版本(见下文)。
如果您对项目、调查结果或数据集有任何疑问,请随时与我们联系。

达特茅斯的学期有节奏吗?

我们有一个假设,达特茅斯学期有一个特征。也就是说,如果我们给达特茅斯的所有学生以StudentLife,我们会发现达特茅斯这个激烈的学期有一个共同的节奏。下面你会看到一些“达特茅斯节奏”的例子。看一看这篇论文以获得更详细的结果。
在这里插入图片描述
这项研究捕捉了达特茅斯一学期的行为趋势。例如,春假归来的学生自我感觉良好、放松(即压力水平较低)、睡得好、经常去健身房。正如图中所示,一旦达特茅斯学期进入期中考试和期末考试,这一切都改变了。
在这里插入图片描述
上面的时间线显示了整个学期的谈话频率和持续时间。学生们以长时间(可能的)社交对话来开启新学期。他们毕竟刚从春假回来。

随着期中考试的临近,他们开始有更频繁的谈话,但谈话的时间更短。在期中周,与学期开始时相比,对话更加高效务实(businesslike);也就是说,学生们的对话更少、更短。随着这一学期的结束,事物发生了变化,人们有了更频繁、更长的对话。
在这里插入图片描述

学期开始,学生非常活跃。奇怪的是,他们在学期的第一周睡眠不足。为什么?可能在学期开始时参加聚会和社交活动。上课出勤率很高。当学期开始进行,事情就发生了变化。期中考试期间,学生的活动量急剧下降至最低水平,并在学期余下的时间里保持这一水平。睡眠也有类似的规律——期中下降到一个低点,在学期末急剧下降。

有趣的是,整个学期的出勤率稳步下降,学生平均只上了25%的课。我们的研究结果也表明,上课出勤率与成绩之间没有相关性。

从手机预测平均绩点(GPA)

许多认知、行为和环境因素都会影响学生在大学期间的学习。SmartGPA的研究使用被动感知数据和学生智能手机的自我报告,来了解在一个为期10周的学期中,表现优异和表现不佳的个体行为差异。我们提出了新的方法来更好地理解一组大学生的学习(如学习时间)和社交(如聚会)行为。我们发现,智能手机中有许多重要的行为因素与学期成绩和累积平均成绩显著相关,包括活动时间序列分析、会话互动、移动能力(mobility)、上课、学习和聚会。我们提出了一个简单的基于lasso正则化的线性回归模型,可以准确预测累积平均绩点。

预测的平均绩点与学生成绩单中的ground truth高度相关(r=0.81,p<0.001),预测的平均绩点在报告成绩的±0.179以内。我们的研究结果为改善学习成绩的新干预措施开辟了道路。

https://studentlife.cs.dartmouth.edu/smartgpa.pdf

在这里插入图片描述
这两个图表现了学生聚会和学习的时间。这些数据由学生的手机自动推断,并与达特茅斯的聚会和学习场景相关联。

在这里插入图片描述
这张图显示了整个学期的聚会趋势。大多数的聚会都是在学期开始的时候,然后逐渐减少,直到春假这一周(被称为绿键GreenKey),当学生们在学期末和期末考试前全力以赴的时候,聚会就很少了。
在这里插入图片描述
这是一个有趣的图。期中考试结束后,课堂出勤率下降,但学习却有相反的增长?学生缺课,但学习更多。

StudentLife数据集

StudentLife数据集是一个大型、纵向的数据集,具有丰富的信息和深度。重要的是,数据集是匿名的,以保护研究参与者的隐私。
数据集来自达特茅斯大学10周春季学期的48名本科生和研究生。它包括超过53 GB的连续数据、32000份自我报告和事后调查;具体包括:
(1)客观感知数据(objective sensing data):睡眠(就寝时间bedtime、持续时间duration、起床时间wake up);对话时间conversation duration、对话频率conversation frequency;体力活动(静止stationary、步行walk、跑步run);

  • 原网址里出现多处conservation,不知道该怎么理解,怀疑是将conversation打错了……

(2)基于位置的数据:位置location、同位置co-location、室内indoor和室外outdoor移动mobility;
(3)其他手机数据:亮度light、蓝牙Bluetooth、音频audio、Wi-Fi、屏幕锁定/解锁、手机充电、应用程序使用情况。
(4)自我报告:影响affect(PAM)、压力、行为、波士顿爆炸案反应、取消课程、班级意见、评论、达特茅斯即刻Dartmouth now、维度事件Dimension incident、维度抗议Dimension protest、餐厅、活动、锻炼、绿键Green Key、实验室、情绪、孤独、社交和学习空间。
(5)前后调查pre-post surveys:PHQ9抑郁量表、UCLA孤独量表、积极和消极影响量表(PANAS)、感知压力量表(PSS)、大五人格big five personality、欣欣向荣量表flourishing scale、匹兹堡睡眠质量指数 Pittsburgh sleep quality index、veterans RAND 12 item health (VR12)(VR12)
(6)学业成绩数据:班级信息,截止日期ddl,成绩(成绩,学期平均成绩,累计平均成绩),piazza数据
(7)就餐数据:用餐数据、地点和时间
(8)座位数据:Android编程学生的座位
(9)出入调查:匿名后添加
(10)Facebook数据:除非我们确信它是完全匿名的,否则我们不确定是否可以发布它

数据集详细描述

https://studentlife.cs.dartmouth.edu/dataset.html

数据集介绍

整个StudentLife数据集位于一个大文件中:full dataset,其中包含所有传感器数据、EMA数据、调查响应和教育数据。
我们可能会出于隐私考虑删除参与者的身份。例如,蓝牙设备的名称可能包含参与者的真实姓名,因为人们使用他们的名字来命名他们的计算机。浏览器日志也会从数据集中删除。WiFi AP的SSID已从数据集中删除,因为达特茅斯学院网络服务不允许我们披露校园WiFi AP部署的任何信息。

我们建议首先将整个数据集导入一个集中的数据存储(例如MongoDB、ApacheCassandra)。这将使数据处理更容易。

引用格式

Wang, Rui, Fanglin Chen, Zhenyu Chen, Tianxing Li, Gabriella Harari, Stefanie Tignor, Xia Zhou, Dror Ben-Zeev, and Andrew T. Campbell. “StudentLife: Assessing Mental Health, Academic Performance and Behavioral Trends of College Students using Smartphones.” In Proceedings of the ACM Conference on Ubiquitous Computing. 2014.

数据目录组织

数据集目录按数据类型组织。StudentLife包括四种类型的数据:sensor data, EMA data, pre and post survey responses and educational data.
顶层目录如下所示。在下面的小节中,我们将在下一节中介绍每个目录的结构和数据格式。

   dataset
   |-user_info.csv
   |-sensing
   |-EMA
   |-education
   |-survey

Sensor data
dataset/sensing中有10个子目录,对应于10种不同的传感器数据:physical activity, audio inferences, conversation inferences, Bluetooth scan, light sensor, GPS, phone charge, phone lock, WiFi, WiFi location。所有传感器数据存储在csv文件中。

每个数据类型子目录下的数据文件按参与者组织。例如,您可以在sensing/activity/activity_u01.csv中找到u01的所有体力活动推断。类似地,您可以在sensing/conversation/conversation_u01.csv中找到u01的会话推断。

   sensing
   |-activity
   |-audio
   |-conversation
   |-bluetooth
   |-dark
   |-gps
   |-phonecharge
   |-phonelock
   |-wifi
   |-wifi_location

EMA数据
您可以在EMA/EMA_definition.json中找到EMA问题定义. 参与者的回答存储在EMA/responses中。EMA/responses下的子目录的名称对应于EMA问题的名称。例如,EMA/responses/Stress包含所有参与者对压力EMA的响应。与传感器数据类似,每个EMA的响应都由参与者的uid组织。您可以在EMA部分找到详细的EMA文件格式。

EMA
   |-EMA_definition.json
   |-response
   |---Activity
   |---Administration‘s response
   |---Behavior
   |---Boston Bombing
   |---Cancelled Classes
   |---Class
   |---Class 2
   |---Comment
   |---Dartmouth now
   |---Dimensions
   |---Dimensions protestors
   |---Dining Halls
   |---Do Campbell's jokes suck?
   |---Events
   |---Exercise
   |---Green Key 1
   |---Green Key 2
   |---Lab
   |---Mood
   |---Mood 1
   |---Mood 2
   |---PAM
   |---Sleep
   |---Social
   |---Stress
   |---Study Spaces

Pre and Post Surveys
所有前后调查的答复都存储在“dataset/survey”下的相应文件中。目录按调查名称组织。例如,您可以在survey/PHQ-9.csv中找到参与者对PHQ-9抑郁量表的前后反应。所有文件均为csv格式,在调查部分中定义。

   survey
   |---BigFive.csv
   |---FlourishingScale.csv
   |---LonelinessScale.csv
   |---panas.csv
   |---PerceivedStressScale.csv
   |---PHQ-9.csv
   |---psqi.csv
   |---vr_12.csv

教育数据
教育数据,包括2013年春季学期的课程、每位参与者的截止日期、CS65的年级和Piazza使用情况,存储在dataset/education下。详细说明见教育资料部分。

   education
   |---class_info.json
   |---class.csv
   |---deadlines.csv
   |---grades.csv
   |---piazza.csv

自动感应
本节介绍dataset/sensing下的自动传感器数据的数据格式。
体力活动推断
参与者身体活动推断文件的前几行如下所示:

timestamp	activity inference
1364356853	0
1364356856	0
1364356858	0

第一行是头行,它定义活动数据文件中有两个字段:时间戳和活动推断(activity inference)id。时间戳是收集推断时的Unix时间。时区是东部时区。
活动分类器以24/7的方式循环运行。为了避免耗尽电池电量,它会连续进行活动推断1分钟,然后暂停3分钟,然后重新开始收集活动推断。它根据智能手机的不同,每2~3秒生成一个活动推断。下表描述了活动推断的含义。

Inference ID	Description
0	Stationary
1	Walking
2	Running
3	Unknown

音频
参与者的物理音频推断文件的前几行如下所示:

timestamp	audio inference
1364356875	0
1364356876	0
1364356877	0

第一行是头行,它定义了音频数据文件中有两个字段:时间戳和音频推断类型id。时间戳是收集推断时的Unix时间。时区是东部时区。
音频分类器以24/7的方式工作循环全天候运行。它进行音频推断1分钟,然后暂停3分钟后重新启动。分类器检测到会话正在运行,则继续进行会话。它每2~3秒产生一个音频推断。下表描述了音频推理的含义。

Inference ID	Description
0	Silence
1	Voice
2	Noise
3	Unknown

Conversation
参与者对话推断文件的前几行如下所示:

start_timestamp	end_timestamp
1364425656	1364425727
1364427639	1364427780
1364428051	1364428485

会话数据文件中有两个字段:会话开始时间戳和会话结束时间戳。例如,在显示上述记录的第一行中,参与者围绕一个从Unix时间戳1364425656到Unix时间戳1364425727的对话。时区是东部时区。

GPS定位
参与者的GPS定位文件的前几行如下所示:

time	provider	network_type	accuracy	latitude	longitude	altitude	bearing	speed	travelstate
1364357009	network	wifi	67.993	43.7066671	-72.2890974	0.0	0.0	0.0	stationary
1364358209	network	wifi	23.0	43.706637	-72.2890664	0.0	0.0	0.0	moving
1364359405	gps		16.0	43.70667831	-72.28901794	136.300003052	96.2	0.25	

每10分钟收集一次GPS坐标。重要数据字段如下:

Field Name	  Description
time	      The Unix time of when it was collected (EST)
provider	  The source of GPS coordinates: GPS or network
network_type  Which network was used to obtain GPS fix when the provider is network
latitude	  Latitude
longitude	  Longitude

…………(就不详细翻译了)

数据集下载链接

https://studentlife.cs.dartmouth.edu/dataset/dataset.tar.bz2

R包

Tidy handling and navigation of the valuable Student-Life mHealth dataset https://github.com/frycast/studentlife
Fryer, Daniel, Hien Nguyen, and Pierre Orban. “studentlife: Tidy Handling and Navigation of a Valuable Mobile-Health Dataset.”

https://www.theoj.org/joss-papers/joss.01587/10.21105.joss.01587.pdf

StudentLife 2.0

StudentLife的下一步是什么?总之,我们想在应用程序中添加干预。在未来,我们希望StudentLife能帮助学生提高学业成绩,同时在校园里过上平衡的生活。
人们可以想象,像StudentLife这样的应用程序可以用来实时反馈校园安全以及学生是否处于危险之中;或者回答诸如“校园现在压力有多大?”或者不是等到学期末才评估课堂质量,这样的工具可以随时对教学质量做出即时反应。
我们故意不给学生任何反馈,因为我们不想把StudentLife作为一种行为改变的工具。我们只是想“记录”他们在校园里的时间。下一步就是提供反馈。例如,我们可能会告知学生一些危险的行为;例如,聚会太多、学习成绩达不到最佳水平的睡眠水平、不良的饮食习惯、社交过于孤立、死气沉沉、挣扎等等。
在这里插入图片描述
校园学生生活中有许多相关者(见上图):学生、教师、学生院长、医生、朋友和家人。它们都只有部分状态信息。我们设想studentlife2.0将允许学生通过共享他们的数据来“连接”这些相关者。这样的愿景代表着一个巨大的隐私问题,需要解决。然而,通过联系相关者,StudentLife可以提供新的干预形式,以促进校园健康生活和安全,并帮助学生调整他们的行为(例如,可以简单到不整晚不睡觉和有规律的睡眠),以提高GPA和校园生活。
我们觉得studentlife1.0只是个开始。敬请期待。

论文

Publications
Weichen Wang, Shayan Mirjafari, Gabriella Harari, Dror Ben-Zeev, Rachel Brain, Tanzeem Choudhury, Marta Hauser, John Kane, Kizito Masaba, Subigya Nepal, Akane Sano, Emily Scherer, Vincent Tseng, Rui Wang, Hongyi Wen, Jialing Wu, Andrew Campbell. Social Sensing: Assessing Social Functioning of Patients Living with Schizophrenia using Mobile Phone Sensing. Proceedings of the ACM Conference on Human Factors in Computing Systems (CHI’20), Honolulu, April. 2020. [pdf]

Mikio Obuchi, Jeremy F Huckins, Weichen Wang, Alex daSilva, Courtney Rogers, Eilis Murphy, Elin Hedlund, Paul Holtzheimer, Shayan Mirjafari, Andrew Campbell. Predicting Brain Functional Connectivity Using Mobile Sensing. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies (IMWUT), March 2020. [pdf]

Jeremy Huckins, Alex W DaSilva, Weichen Wang, Elin L Hedlund, Courtney Rogers, Subigya K Nepal, Jialing Wu, Mikio Obuchi, Eilis I Murphy, Meghan L Meyer, Dylan D Wagner, Paul E Holtzheimer, Andrew T Campbell. Mental Health and Behavior During the Early Phases of the COVID-19 Pandemic: A Longitudinal Mobile Smartphone and Ecological Momentary Assessment Study in College Students. Journal of Medical Internet Research (JMIR), 2020;22(6):e20185 [pdf]

Gabriella M Harari, Sandrine R Müller, Clemens Stachl, Rui Wang, Weichen Wang, Markus Bühner, Peter J Rentfrow, Andrew T Campbell, Samuel D Gosling. Sensing sociability: Individual differences in young adults’ conversation, calling, texting, and app use behaviors in daily life. Journal of Personality and Social Psychology, May 20, 2019. [pdf]

Jeremy F. Huckins, Alex W. daSilva, Rui Wang, Weichen Wang, Elin L. Hedlund, Eilis I. Murphy, Richard B. Lopez, Courtney Rogers, Paul E. Holtzheimer, William M. Kelley, Todd F. Heatherton, Dylan D. Wagner, James V. Haxby and Andrew T. Campbell. Fusing Mobile Phone Sensing and Brain Imaging to Assess Depression in College Students. Frontiers in Neuroscience, Volume 13 Page 248, 21 March 2019. [pdf]

Alex W DaSilva, Jeremy F Huckins, Rui Wang, Weichen Wang, Dylan D Wagner, Andrew T Campbell. Correlates of Stress in the College Environment Uncovered by the Application of Penalized Generalized Estimating Equations to Mobile Sensing Data. JMIR mHealth and uHealth (JMU), 2019, 7(3): e12084. [pdf]

Weichen Wang, Gabriella M. Harari, Rui Wang, Sandrine R. Müller, Shayan Mirjafari, Kizito Masaba and Andrew T. Campbell. Sensing Behavioral Change Over Time: Using Within-Person Variability Features from Mobile Sensing to Predict Personality Traits. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies (IMWUT) Volume 3 Issue 2, September 2018. [pdf]

Rui Wang, Weichen Wang, Alex daSilva, Jeremy F. Huckins, William M. Kelley, Todd F. Heatherton, and Andrew T. Campbell. Tracking Depression Dynamics in College Students Using Mobile Phone and Wearable Sensing. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies (IMWUT) Volume 2 Issue 1, March 2018, Article No. 43. [pdf]

Harari, G. M., Gosling, S. D., Wang, R., Chen, F., Chen, Z., Campbell, A. T. (2017). Patterns of Behavior Change in Students Over an Academic Term: A Preliminary Study of Activity and Sociability Behaviors Using Smartphone Sensing Methods. Computers in Human Behavior, 67, 129-138. [pdf]

Saeb S, Lattie EG, Schueller SM, Kording KP, Mohr DC. (2016) The relationship between mobile phone location sensor data and depressive symptom severity. PeerJ 4:e2537 [pdf]

Harari, G. M., Lane, N. D., Wang, R., Crosier, B., Campbell, A. T., & Gosling, S. D. (in press). Using Smartphones to Collect Behavioral Data in Psychological Science: Opportunities, Practical Considerations, and Challenges. Perspectives on Psychological Science.[pdf]

Colvin, C. R., Tignor, S. M., Wang, R., & Campbell, A. (January, 2016). Individual differences in mobility patterns and personality. The 17th Annual Meeting for the Society for Personality and Social Psychology, San Diego, CA.

Rui Wang, Min S. H. Aung, Saeed Abdullah, Rachel Brian, Andrew T. Campbell, Tanzeem Choudhury, Marta Hauser, John Kane, Michael Merrill, Emily A. Scherer, Vincent W. S. Tseng, and Dror Ben-Zeev. “CrossCheck: Toward passive sensing and detection of mental health changes in people with schizophrenia.” In Proceedings of the 2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing, pp. 886-897. ACM, 2016. [pdf]

Rui Wang, Gabriella Harari, Peilin Hao, Xia Zhou, and Andrew T. Campbell. “SmartGPA: How Smartphones Can Assess and Predict Academic Performance of College Students.” To be presented at ACM Conference on Ubiquitous Computing (UbiComp 2015), Osaka, Japan from Sep. 7-11, 2015 Honorable Mention Award [pdf]

Rui Wang, Xia Zhou, and Andrew T. Campbell. “Using Opportunistic Face Logging from Smartphone to Infer Mental Health: Challenges and Future Directions.” To be presented at 4th ACM Workshop on Mobile Systems for Computational Social Science (MCSS 2015), Osaka, Japan from Sep. 7-11, 2015 [pdf]

Sophia Haim, Rui Wang, Sarah E. Lord, Lorie Loeb, Xia Zhou, and Andrew T. Campbell. “The Mobile Stress Meter: A New Way to Measure Stress Using Images.” To be presented at 4th ACM Workshop on Mobile Systems for Computational Social Science (MCSS 2015), Osaka, Japan from Sep. 7-11, 2015 [pdf]

Dror Ben-Zeev, Emily A. Scherer, Rui Wang, Haiyi Xie, and Andrew T. Campbell. “Next-generation psychiatric assessment: Using smartphone sensors to monitor behavior and mental health.” Psychiatric Rehabilitation Journal, Vol 38(3), Sep 2015 [pdf]

Randy Colvin, Stefanie Tignor, Rui Wang, Andrew T. Campbell, Inching Closer to Objective Personality Assessment: The Promise of Smartphone Data, the Society for Personality and Social Psychology (SPSP), Long Beach, CA February, 2015.

Colvin, C. R., Tignor, S. M., Campbell, A. T., & Wang, R. (February, 2015). Inching closer to objective personality assessment: The promise of smartphone data. The 16th Annual Meeting for the Society for Personality and Social Psychology, Long Beach, CA.

Tignor, S. M., Colvin, C. R., Wang, R., & Campbell, A. (April, 2014). Illuminating student well-being using real-world behavior tracking. The 3rd Annual Boston-area Graduate Student Symposium, Boston, MA.

Gabriella M. Harari, Samuel D. Gosling, Rui Wang, Andrew T. Campbell, Capturing Situational Information with Smartphones and Mobile Sensing Methods, European Journal of Personality, 2015.[pdf]

Rui Wang, Fanglin Chen, Zhenyu Chen, Tianxing Li, Gabriella Harari, Stefanie Tignor, Xia Zhou, Dror Ben-Zeev, and Andrew T. Campbell. “StudentLife: Assessing Mental Health, Academic Performance and Behavioral Trends of College Students using Smartphones.” In Proceedings of the ACM Conference on Ubiquitous Computing. 2014. Nominated for the best paper award (top 5% of all papers) [pdf]

Fanglin Chen, Rui Wang, Xia Zhou, and Andrew T. Campbell. “My smartphone knows i am hungry.” In Proceedings of the 2014 workshop on physical analytics, pp. 9-14. ACM, 2014. [pdf]

Zhenyu Chen, Mu Lin, Fanglin Chen, Nicholas D. Lane, Giuseppe Cardone, Rui Wang, Tianxing Li, Yiqiang Chen, Tanzeem Choudhury, Andrew T. Campbell, Unobtrusive Sleep Monitoring using Smartphones, 7th International ICST Conference on Pervasive Computing Technologies for Healthcare (Pervasive Health ’13), May 2013 [pdf]

Presentations
Andrew Campbell “My brother Ed: Mental illness was not his choice.”, Presented at the ACM UbiComp workshop on mental health, September 2016

Harari, G. M., Wang, R., Campbell, A. T., & Gosling, S. D. (2016, January). Capturing Sociability Behaviors Using Smartphone Sensing. Presented at the Society for Personality and Social Psychology, San Diego, CA.

Andrew Campbell “StudentLife: Using Smartphones to Assess Mental Health and Academic Performance of College Students”, GVU Center Brown Bag Seminar Series: Andrew Campbell, November, 2015

Rui Wang “SmartGPA: How Smartphones Can Assess and Predict Academic Performance of College Students”, ACM UbiComp, Sept 11, 2015

Andrew Campbell “StudentLife”,Keynote on StudentLife, AAAI ICWSM Conference, Oxford, May 2015

Andrew Campbell “What happens when life throws you a googly?”, Wireless Health Conference, 2014

Rui Wang “StudentLife: Assessing Mental Health, Academic Performance and Behavioral Trends of College Students using Smartphones”, ACM UbiComp, Sept 15, 2014

Rui Wang “My smartphone knows i am hungry.”, Workshop on Physical Analytics, June 16, 2014

  • 3
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
处理凯斯西楚大学数据集需要一些准备工作,包括安装必要的Python库和准备数据集。 首先,你需要安装以下Python库: - pandas:用于数据处理和分析 - numpy:用于数据科学计算 - matplotlib:用于数据可视化 你可以使用以下命令在终端或命令提示符中安装这些库: ``` pip install pandas numpy matplotlib ``` 接下来,你需要准备数据集。你可以从凯斯西楚大学的官方网站下载数据集,也可以使用以下命令从Kaggle下载: ``` !kaggle datasets download -d uciml/student-alcohol-consumption ``` 下载完成后,你需要解压缩文件,并将csv文件放在当前工作目录中。 接下来,你可以使用以下代码来读取并处理数据: ```python import pandas as pd # 读取数据集 df = pd.read_csv("student-alcohol-consumption.csv") # 查看数据集前五行 print(df.head()) # 统计每个性别的人数 print(df["sex"].value_counts()) # 统计每个性别在所有年级中的平均成绩 print(df.groupby("sex")["G1", "G2", "G3"].mean()) # 绘制每个性别在所有年级中的平均成绩条形图 df.groupby("sex")["G1", "G2", "G3"].mean().plot(kind="bar") ``` 以上代码将读取数据集,展示前五行数据,统计每个性别的人数,计算每个性别在所有年级中的平均成绩,并绘制每个性别在所有年级中的平均成绩条形图。 你可以根据自己的需求进行数据处理和分析,使用Python的数据处理和科学计算库进行数据操作和可视化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值