杂谈——处理大量数据时候的一些思考

最近一直在和大数据打交道,今天看了会书,做个笔记。

1.访问全部数据时间过长

解决办法:循环读取部分数据,进行相应操作。

2.数据难以放入内存 

解决办法:

①既然数据难以放入内存,那么我们就将数据存储到磁盘上面,循环地去读磁盘,这里要考虑IO复杂性,毕竟访问外存的效率要比访问内存的效率低。

②仅基于少数数据去进行计算。当然,这样得到的结果的准确率也会受到影响。

3.单个计算机难以保存全部数据,但是计算有需要整体的数据。

解决办法:这个时候就需要多台机器一起工作了,也就是所谓的并行处理。譬如mapReduce,hadoop,都是面向并行处理而提出的。

4.计算机计算能力不足或者知识不足

解决方法:计算机干不了,那当然就需要人来进行干涉了,也就是所谓的众包算法。

 

总结:对于第一点来说,它的数据量可能并不是很大,但是你拿到数据之后的逻辑操作这一个过程可能会比较长,整体处理的效率比较低。举个例子,如果如果我要一次性拿到两万条数据,去读这两万条数据进行操作,那么读数据库的耗时就不可小觑了,倘若在操作中又要多次操作数据库,那么时间消耗就很大了(这里要注意,对于操作数据库中的大数据量,我们要尽量地将自己的sql语句优化到最好,减少时间消耗)。对于这种情况,我们基本上都是建议将数据分批处理。因为有时候项目可能很急,如果大家都等着你将全部数据处理完,然后再进行下一步操作,那么这样的效率就很低。而我们往往都是要求将任务并行地进行,因此,大部分时候,最好的话,还是希望可以先得到部分数据,分批进行。如果中途停止了,那么我们也可以很好地将任务续上。

而对于第二点来说呢,数据的体量自然是大于第一点,因为你数据都放不进内存,更别说一次性处理整体的数据里。这个情况,最典型的就是我们经常说的topK的问题。这种问题的开头通常是:“我有一个T的数据,要找出里面的topK......”怎么做?一次性将数据读到内存里面?谁家内存这么大呀!显然是不可能呀,遇到这种情况,我们经常将数据分成很多小份,像分治法之类的。在上文中也提到了“仅及于少数数据去进行计算”,这里主要看需求上对准确率的要求如何了。很多时候,采样也是可以得到较为客观的结果的。

至于第三种,我暂时还没有相关经验,晚些时候再来总结。第四种,我们平常遇到很多,也就不提了。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
姿态传感器是一种用于测量物体姿态的传感器,它可以检测物体的加速度和角速度,并计算出物体的方向和角度。MPU6050是一种常用的姿态传感器,它具有高精度、低功耗和成本低廉的特点。本文将介绍MPU6050的基本原理、工作方式、应用领域以及优缺点。 一、基本原理 MPU6050由三轴加速度计和三轴陀螺仪组成,它可以测量物体在x、y、z三个方向上的加速度和角速度。加速度计可以检测物体的线性加速度,而陀螺仪可以检测物体的角速度。通过将加速度计和陀螺仪的测量结果进行组合,可以计算出物体的方向和角度。 二、工作方式 MPU6050采用I2C总线通信协议,可以直接连接到微控制器或单片机上。在使用MPU6050之前,需要进行校准,以保证其测量结果的准确性。校准过程可以通过软件或硬件进行。 MPU6050工作时,会不断地读取加速度计和陀螺仪的数据,并进行数据处理和滤波。处理后的数据可以通过I2C总线发送给微控制器或单片机,以供后续处理和应用。在实际应用中,可以通过算法将MPU6050的测量结果转换成物体的方向和角度。 三、应用领域 MPU6050在机器人、无人机、智能家居等领域有广泛的应用。在机器人领域,MPU6050可以用于测量机器人的姿态和运动状态,以实现精确的定位和控制。在无人机领域,MPU6050可以用于测量无人机的姿态和角速度,以实现稳定的飞行。在智能家居领域,MPU6050可以用于测量家居设备的姿态和运动状态,以实现智能化控制。 四、优缺点 MPU6050具有高精度、低功耗和成本低廉的优点。它可以实现较高的测量精度和稳定性,同时功耗较低,适合于嵌入式系统和移动设备。另外,由于其成本低廉,可以广泛应用于各种领域。 然而,MPU6050也存在一些缺点。首先,它只能测量物体在x、y、z三个方向上的加速度和角速度,无法对物体的位置进行直接测量。其次,MPU6050的测量结果受到环境因素的影响较大,需要进行校准以保证测量精度。最后,由于其测量结果的准确性受到多种因素的影响,需要通过算法进行数据处理和滤波,才能得到可靠的结果。 总之,MPU6050是一种非常实用的姿态传感器,具有广泛的应用前景。在实际应用中,需要结合具体的场景和需求,进行合理的选择和使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值