用python处理RealityMining数据

前言由于学习的需要最近要使用到MIT的RealityMining数据集(数据是mat格式),对于习惯使用python的自己还是比较麻烦的,所以在使用之初就想着怎么把mat文件转换为csv,在转换的过程中也尝试使用python调用matlab的接口用于转换时间的格式。数据地址http://realitycommons.media.mit.edu/realitymining4.html...
摘要由CSDN通过智能技术生成

前言

由于学习的需要最近要使用到MIT的RealityMining数据集(数据是mat格式),对于习惯使用python的自己还是比较麻烦的,所以在使用之初就想着怎么把mat文件转换为csv,在转换的过程中也尝试使用python调用matlab的接口用于转换时间的格式。

数据地址

http://realitycommons.media.mit.edu/realitymining4.html

使用的数据

RealityMining数据集中包含两个部分,一个部分是s,另一部分是network。s中包含了106个数据样本的各种通信信息以及问卷调查信息,network中包含了朋友关系的标注信息等。我使用到的信息为s.comm和network.friends,其中s.comm中包含了每一个数据样本(人)的通信信息:通信日期,通信人,通信形式等。

转换代码

python

import scipy.io as sio
import matlab.engine
import time
from datetime import datetime


def save_to_local_communication_data(dataPath, savePath):
    eng = matlab.engine.start_matlab()  # 启动matlab引擎
    '''
    数据保存格式:人员,时间,联系人,联系方式,方向,持续时间

    '''
    data = sio.loadmat(dataPath)
    s = data['s']
    length_s = s.shape[1]
    # length_s_n_comm = s[0][0][0].shape[1]
    print(length_s)
    # print(length_s_n_comm)
    with open(savePath, "w", newline="") as csvfile:
        csvfile.write('people' + ',' + 'date' + ',' + 'contact' + ',' + 'description' + ',' + 'direction' + ',' +
                      'duration' + '\n')
        for i in range(length_s):
            length_s_comm_temp = s[0][i][0].shape[1]
            if not length_s_comm_temp == 0:
                for j 
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
Python可以使用多种工具和库来处理表格数据,其中一些最常用的包括: 1. pandas:pandas是一个强大的数据处理库,可以用于读取、操作和分析表格数据。它可以处理各种格式的数据,包括CSV、Excel、SQL数据库、JSON等。 2. numpy:numpy是一个Python科学计算库,可用于处理数值数据。它提供了一些有用的函数和工具来处理数组和矩阵数据,以及进行数学计算和统计分析。 3. openpyxl:openpyxl是一个Python库,用于读取和写入Excel文件。它允许您读取和写入Excel文件中的单元格、行、列和工作表。 4. xlrd和xlwt:这两个Python库用于读取和写入Excel文件。虽然openpyxl在处理Excel文件方面更为强大,但是在某些情况下,这些库可能更适合您的需求。 5. csv:csv是Python标准库中的一个模块,用于读取和写入CSV文件。它提供了一些有用的函数和工具来处理逗号分隔的数据。 您可以使用这些库的一些基本功能来处理表格数据,例如: 1. 读取表格数据:使用pandas、openpyxl、xlrd或csv库中的函数来读取表格数据。 2. 清理和转换数据:使用pandas或numpy库中的函数来清理和转换数据,例如删除重复行、填充缺失值、更改数据类型等。 3. 进行统计分析:使用pandas或numpy库中的函数来计算平均值、中位数、标准差等统计数据,或者使用一些高级函数来进行数据透视表、分组和聚合。 4. 可视化数据:使用pandas或matplotlib库中的函数来创建图表和可视化数据,以便更好地理解和分析数据。 这只是Python处理表格数据的一些基本方法。随着您对这些库和其他相关库的熟练掌握,您可以处理更复杂的表格数据,从而实现更高级的数据分析和可视化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值