马蜂窝“评论造价事件”,是事实?还是被人坑了?

一篇题为《估值175亿的旅游独角兽,竟是一座僵尸和水军构成的鬼城?》的文章在网络上刷屏,一时间让事件主角马蜂窝成为舆论焦点。文章直指马蜂窝2100万的“真实点评”中有1800万条数据是通过机器人从点评和携程等竞争对手那里抄过来的,并宣称以“一字不落”才算抄袭的标准,发现了7454个抄袭账号,合计抄袭572万条餐饮点评,1221万条酒店点评。除了这些数据抄袭之外,马蜂窝平台周末的活跃性跟大众点评、携程相比也是一改反常。

马蜂窝数据造假是存在的事实

实际上马蜂窝数据造假这件事并不是空穴来风, 在媒体大量的曝光之后,马蜂窝方面也做出了回应,并且承认其数据的真实性确实存在一些问题,在10月23日下午,马蜂窝旅游网在北京召启动“圣地巡礼”计划的开发布会,会后马蜂窝联合创始人兼CEO陈罡接受21世纪经济报道记者采访时就表示,针对这几天网上出现的“马蜂窝点评数据相关问题”,马蜂窝认真进行了自查,“核查结果显示,马蜂窝在餐饮等点评数据方面存在部分问题,但远没有外界所表述的那么夸大。马蜂窝已开始对相关问题进行整改,并重新梳理工作流程,堵住漏洞。”马蜂窝数据造假事件之所以发展成今天这样局面,跟他本身就存在数据造假的事实有很大的关系,可谓是“苍蝇不叮无缝的蛋”。

但其实并不是马蜂窝一家存在数据造假的情况,甚至可以说互联网行业数据造假已经成为了行业的一个通病,据京比特查询的资料来看其实数据造假并不是马蜂窝这个平台独有的操作,之前也有携程、美团、途牛等都有爆出数据造假的风波,就比如美团点评,不久前小红书官方微博及其部分内容作者纷纷投诉大众点评,称其未经授权抄袭其大量内容,甚至出现了自己的“山寨账号”。随后小红书官方微博也发表声明,谴责大众点评的抄袭行为,强调“小红书非一天建成,也不可能被一键复制”。据小红书估计,抄袭的数量在百万条量级!随后大众点评在官微上道歉,表示事件起因是大众点评新上线试运营的推荐栏目在未经授权的情况下对相关内容进行了违规转载,已完成内容排查与清理下线。

马蜂窝近年的快速发展威胁到竞争对手

马蜂窝旅游网创立于2006年,从2010年正式开始公司化运营。相比1999年就创立的行业“大佬”携程,马蜂窝绝对是“后起之秀”;而同样经营旅游行业产业链上游的穷游网创立于2004年,同样比马蜂窝早。从2011年开始,马蜂窝一直保持着两年进行一次融资的速度,马蜂窝的每一轮扩张都踩准了行业发展的关键节点,也正是因此,自创立十数年之后,马蜂窝在行业中的规模和地位超越了许多同期发展起来的竞争对手。

今年8月,马蜂窝启动新一轮融资的消息传出,根据京比特查询的资料来看,马蜂窝希望在新一轮融资中筹集至多3亿美元(约合人民币20.81亿元),此轮融资对该公司的估值定为20亿至25亿美元(约合人民币138.73亿元至173.41亿元)。此次融资对马蜂窝来说可谓是意义非凡,关系着马蜂窝能否进入到国内旅游网站前五的排名,就目前来看,国内主要旅游网站的排名顺序分别是,携程、美团点评、飞猪三家依次位列前三,同城艺龙、途牛等紧随其后,而马蜂窝的排名则相对靠后。据行业内的人事分析,马蜂窝想要进入前五,那么此轮融资后的估值必须达到到140至175亿,只有这样马蜂窝才能能够进入中国旅游网站的第二梯队。且在第二梯队中处于相当靠前的位置。

显然此次马蜂窝如果顺利完成融资的话,不仅威胁到同城艺龙、途牛等第二梯队的成员,以此前马蜂窝发展和扩张的速度来看对第一梯队的携程、美团点评、飞猪也会造成不小的威胁。马蜂窝的数据造假事件将会成为马蜂窝发展历史上一个抹不去的污点,数据造假事件也会对马蜂窝此次融资造成一定的影响。京比特不否认马蜂窝本身就存在数据造假方面的问题,但在如此关键的时候爆出数据造假新闻不得不让人联想到竞争对手的恶意抨击。

创业者不应把业潜规则当做正当的存在

根据京比特查询的资料来看,目前一条微信公号后的留言0.3元,1000人次的微信阅读收费几十元等。时下,攻略、点评的商业化已然大势所趋,浏览点评再决定下单是许多人的消费习惯。于是,优质点评、精彩攻略等成为旅游在线网站争夺的稀缺资源。正因为资源稀缺,一些商家或用户采取抄袭、搬运的方式大规模提交点评。极少数企业为了体现漂亮数据,给投资者讲好故事,对此也睁只眼闭只眼,甚至主动动用“水军”。马蜂窝之所以卷入此次事件,就是因为把行业的潜规则当做成了正当的存在。

马蜂窝爆出数据造假事件成为众矢之的,应该还是给马蜂窝敲了一个警钟。以前抄袭、搬运内容纠纷打官司非常麻烦。一般的平台对用户上传的内容是不负责的,申诉的话大多删除内容即可。这就衍生了一种恶劣的“避风港规则”——“先侵权、等通知;不通知、不负责;你通知、我删除、我免责”。这样的方式不管是对上传内容的用户、消费者还是同行企业都是及不负责任的方式,对于对上传内容的用户来说原创内容没有得到保护,对于消费者来说则会误导消费,对于同行业来说则是一种不正当的竞争关系。

今年8月,《电子商务法》获得通过,将于明年1月1日起施行。其中第十七条明确规定:“电子商务经营者不得以虚构交易、编造用户评价等方式进行虚假或者引人误解的商业宣传,欺骗、误导消费者。”这意味着,点评数据造假不再是单纯的失信行为,而是涉嫌违法。这也将进一步规范行业的竞争关系。

Python爬虫是一种用于自动化获取网络上数据的技术,可以用来爬取各类网站的内容。马蜂窝是一个旅游网站,用户可以在其中发布旅游攻略、游记、评论等信息。如果想要爬取马蜂窝上的评论,可以通过Python爬虫来实现。 首先,需要分析马蜂窝网页的结构,找到包含评论信息的标签和类名等相关信息。可以利用浏览器开发者工具来查看网页源代码,寻找评论所在的HTML元素。 然后,使用Python的爬虫库,例如BeautifulSoup、Requests等,来发送HTTP请求获取网页内容,并解析网页。首先发送一个请求获取网页源代码,然后使用BeautifulSoup等库解析HTML,找到评论所在的标签和属性,进而提取出评论内容。 接下来,可以编写循环来遍历多个页面,因为马蜂窝评论可能会分页展示。可以通过修改URL的参数来获取下一页的评论内容,并将获取到的评论数据添加到一个列表或文件中保存。 为了防止被网站封IP或其他反爬措施,可以模拟浏览器行为,例如添加User-Agent、增加访问时间间隔等来降低爬虫被发现的概率。 最后,可以根据需求对爬取的评论数据进行处理和分析,例如统计热门景点的评价情况、评论者的情感分析等。 需要注意的是,爬取网站数据要遵守法律法规和网站的使用规定,不得进行非法的行为,例如恶意攻击网站、侵犯用户隐私等。同时,为避免给网站造成过多的访问压力,可以控制爬取频率,适度使用缓存技术,尊重网站的服务器资源。 综上所述,通过Python爬虫可以很方便地实现马蜂窝评论的爬取,通过分析网页结构、发送HTTP请求、解析HTML等步骤,可以获取到评论数据并进行后续处理和分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值