日志数据分析关乎企业风险管控

近日,一篇《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城》的自媒体文章,引起业界高度关注。文章直指“马蜂窝”数据造假,称马蜂窝从其他平台抄袭搬运的点评,占马蜂窝官网总点评数的85%。作为一家风头正盛的旅游网站,马蜂窝对此表示不服,把当事方(深圳市乎睿数据有限公司及自媒体文章作者丁子荃)告上了法庭。

真相到底是什么,局外人可能没办法准确判断。但是,从技术角度来看,这次“马蜂窝被捅”事件反应出几个值得争议的热点。

第一,对于“爬虫工具”的使用问题。 随着大数据的兴起,有越来越多的企业和个人意识到结构化、非结构化数据的重要性。如何采集及整理这些数据,进一步挖掘商业价值?于是,爬虫软件工具开始盛行。我们随便一搜,什么八爪鱼、集搜客、熊猫采集等等,一抓一大把。这些工具软件的卖点是简单、易用,即使是不懂代码的业务人员,也能使用。但是,这些软件是否能随便在市面上售卖?如果可以买卖,是不是要约束下对方的使用范围?深圳市乎睿数据有限公司,这次捅“马蜂窝”的工具,也是借助“机器人”来完成。

第二、随便爬对方的数据,是否构成侵权 。很多互联网公司创业,基本没有自己的数据,只好从其他平台,甚至是竞争对手的平台“爬数据”,这已成行业潜规则。这样的“潜规则”,是否合法?

第三、作为受害方,我们如何通过日志数据分析控制未知风险。 不管怎么说,“数据造假”给“马蜂窝”带来了大量的负面效果。多年积累起来的用户形象,毁于一旦。如果说,马蜂窝确有其实,那就需要从道德和法律层面综合考量。如果这次事件是有人故意找茬,我们要思考如何通过技术手段保护自己。爬虫、撞库、黑客攻击……作为互联网人,这些技术我们早已耳熟能详。但是,如果被别有用心的人利用,后果不堪想象。

什么是爬虫?爬虫本身就是网络机器人,是一种能够自动在Web上根据某种策略进行远程数据搜索与获取的程序,也被称为网络蜘蛛或网络爬虫。百度、谷歌等搜索引擎,都是借助这一技术进行信息搜集。但是,不友好的自动访问会带来许多问题,除了涉及商业机密,还会占据平台带宽,影响正常用户的访问。

所以,对于管理人员来说,有必要建立一个已知网络机器人的数据库。数据库字段包括网络机器人的标识agent和网络机器人所在的服务器IP地址,然后通过检测访问者的IP地址来进行识别。对于未知的网络机器人,虽然我们的监测能力有限,但是可以从日志中挖掘出每天Web端的访问情况,建立有效的风险模型,就有可能识别出可疑IP。如果日志记录中发现异常IP,完全可以通过技术手段屏蔽掉。Web日志包含的信息量虽然不多,但是从日志字段值中可以发现异常用户操作行为。

所以,基于大数据的日志数据分析变得越来越重要,它不只满足动态安全管理需要,也是运维人员进行风险管控的有力抓手。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31545808/viewspace-2217721/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/31545808/viewspace-2217721/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、MATLAB、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】:所有源码都经过严格测试,可以直接运行。功能在确认正常工作后才上传。 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】:项目具有较高的学习借鉴价值,也可直接拿来修改复刻。对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同进步。【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、MATLAB、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】:所有源码都经过严格测试,可以直接运行。功能在确认正常工作后才上传。 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】:项目具有较高的学习借鉴价值,也可直接拿来修改复刻。对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同进步。【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、MATLAB、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】:所有源码都经过严格测试,可以直接运行。功能在确认正常工作后才上传。 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】:项目具有较高的学习借鉴价值,也可直接拿来修改复刻。对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同进步。【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、MATLAB、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】:所有源码都经过严格测试,可以直接运行。功能在确认正常工作后才上传。 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】:项目具有较高的学习借鉴价值,也可直接拿来修改复刻。对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同进步。【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、MATLAB、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】:所有源码都经过严格测试,可以直接运行。功能在确认正常工作后才上传。 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】:项目具有较高的学习借鉴价值,也可直接拿来修改复刻。对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同进步。【项目资源
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值