每次输入验证码,你都在义务为Google劳动

最近看到了一篇文章,一个小小的验证码,它可以玩的很高端,惊叹歪果仁的思维真超前,方案确实有前瞻性。

今天,应用最广的验证码系统就是 reCAPTCHA (Completely Automated Public Turing Test To Tell Computers and Humans Apart,区分人机的全自动图灵测试系统)了。

那么,reCAPTCHA 到底做了多大贡献呢?

2007 年推出之初,reCAPTCHA 每天都能帮助录入 3000 万个字符。2008年,这个数字飙升到了 6000 万个。粗略统计,在今天,全世界每天都有 2 亿个字符通过 reCAPTCHA 录入,相当于人类 15 万小时的工作量。

也就是说,一个人要不吃不喝不睡连轴转两年半,才能完成 reCAPTCHA 一天的工作量。

到今天为止, reCAPTCHA 已经录入了从 1851 年至今的所有《纽约时报》,共计 1300 万篇文章。除《纽约时报》外,reCAPTCHA 还数字化了超过 2500 万本书,而全球的图书数量约为 1.3 亿本。

路易斯在接受媒体 The Hustle 采访时这样评价 reCAPTCHA :“我创造了一个系统,以十秒为单位,数百万小时为增量,来利用世界上最宝贵的资源:人的大脑。

2007 年,reCAPTCHA 的创始人之一,卡内基梅隆大学教授路易斯·冯·安(Luis von Ahn)想到:“如果人类与机器各有擅长,能不能利用验证码系统,让人类和机器共同解决问题呢?”,当时,一个亟待解决的问题就是,如何把浩如烟海的人类纸质典籍数字化。想要数字化文本,一种方法是手工录入。这种方法费时费力,还容易出现录入错误。另一种方法是先扫描文本,再结合光学文字识别技术录入文字。听起来很美,但有些年代久远或本身质量就差的文本扫描出来后实在是太糊了……为了解决文本数字化的问题,2007 年,路易斯推出了新的验证码系统 reCAPTCHA

2009 年,Google 以大约 2780 万美元的价格收购了 reCAPTCHA,并开始利用 reCAPTCHA 帮助标注数据。

2012 年,Google 开始把 Google 街景中难以识别的门牌和路牌加入验证码,请用户帮忙标注。

对于这一目的,Google 也并不避讳。在 reCAPTCHA 官网上,Google 公开说明了 reCAPTCHA 集众人之力标注数据、训练 AI 的“众包”模式。

如今,Google AI 已经能精确辨认路牌上的文字和数字,准确度和人眼不相上下。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值