数据处理程序的一点经验

      背景:前几天,同事告诉我DSR(内部一个数据处理应用)又挂了,这次的数据丢失特别严重,有25天的数据受到影响。这已经是上线来的第三次出问题了,如果再不认真处理,下次肯定还会有这种问题。

结合同事经常抱怨的事情和我自己的经验,数据处理程序里常见的坑点有:
     1.程序升级、迁移等运维需求导致配置错误
     2.程序自身的bug
     3.外部依赖项的变更
     4.部分内容缺少相应的测试环境,测试困难


      对于第一点,比较好的方案是使用两套配置文件:开发和线上,基于maven的profile,可以很方便地做到这点,这样把配置的工作的将由程序来完成,可以减少人工出错,也便于开发和维护。同时,在修改完成配置后,需要去检查配置到底生效没有
      对于第2个问题,我觉得既然bug无法彻底消除,那就要想办法降低它的伤害,并提高调试开发的工作效率。首先就是要把原始的数据记录下来,例如,从消息队列中读取的每条消息,都可以存起来,这样当程序没有正确保存数据时,还可以在修复完数据之后把这部分数据追加回去。其次是记录程序中发生的异常,并在关键逻辑节点上输出日志,这样调试找问题的时候就会非常简单。
     第3个问题的话,就需要引入监控,外部依赖项的变更导致的各种异常,如输出数据的数量、外部接口的调用情况、异常的次数等,通过统计程序的运行情况,可以较快地发现,从而减少这个依赖项变化带来的破坏。
其他的经验还包括:
    a.对于数据处理程序应该有至少两种运行模式:
        1.定时运行的正常模式
        2.补充数据时的批处理模式,最好允许在命令中输入参数,对于调试会比较方便
        3.测试接口和验证特定数据的测试模式,可选
    b.过早的优化是魔鬼。先弄清楚需求,搞清楚数据量、接口吞吐量等功能非功能性需求之后,再去考虑性能等问题,过早的优化只会让自己陷入泥潭
    c.对程序的关键/重要依赖项和指标进行监控,出现问题里及早修复

  以上就是这段时间主要碰到的问题和解决方式
Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐.zip项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松复刻,拿到资料包后可轻松复现出一样的项目,本人系统开发经验充足(全领域),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助。 【资源内容】:包含完整源码+工程文件+说明(如有)等。答辩评审平均分达到96分,放心下载使用!可轻松复现,设计报告也可借鉴此项目,该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的。 【提供帮助】:有任何使用问题欢迎随时与我联系,我会及时解答解惑,提供帮助 【附带帮助】:若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步 【项目价值】:可用在相关项目设计中,皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面,可借鉴此优质项目实现复刻,设计报告也可借鉴此项目,也可基于此项目来扩展开发出更多功能 下载后请首先打开README文件(如有),项目工程可直接复现复刻,如果基础还行,也可在此程序基础上进行修改,以实现其它功能。供开源学习/技术交流/学习参考,勿用于商业用途。质量优质,放心下载使用。
在2023年的数学建模国赛中,进行数据处理是解决问题的一个重要环节。在数据处理阶段,需要考虑数据的准确性和完备性,并通过适当的数学方法和算法来处理数据,以得到有意义的结果。引用[1]提到评价数学模型的一个重要因素是数据的准确性和完备性,因此在数据处理中,需要确保数据的质量。 对于数据处理的具体方法,可以根据实际问题的特点和需求来选择。例如,可以使用统计分析方法对数据进行整理、清洗和预处理,以去除异常值或缺失值,并提取出有用的特征。同时,可以运用数学建模中常用的数学方法和算法,如回归分析、聚类分析、时间序列分析等,对数据进行分析和建模。 另外,在数据处理过程中,还可以运用编程技术来实现自动化处理和分析。引用提到,在数学建模国赛中,时间非常紧张,因此编程技术的运用可以提高数据处理的效率和准确性。通过编程,可以编写程序来处理大量的数据,并进行计算、模型构建和结果分析。这样可以节省时间,同时提高数据处理的可靠性和复现性。 总之,在2023数学建模国赛的数据处理过程中,需要综合考虑数据的准确性和完备性,选择合适的数学方法和算法,并结合编程技术来实现高效、可靠、准确的数据处理。这样才能有效地解决实际问题,并给出有意义的解决方案。引用再次强调了这一点,指出数学建模问题的评价并不在于模型用了怎样的数学方法,而在于它能否有效地解决实际问题,并在求解过程中给出高效、可靠、准确的解决方案。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值