对整个网站进行大写拼写检查(排序)的程序化黑客想法

是我自己,还是现代的开源CMS在拼写检查起作用的地方基本失败了? 我的意思是,当然,大多数编辑器(即,您在WordPress,Joomla等中键入博客文章的框)都具有拼写检查按钮。 但是尽管如此,错别字仍会流连到网站上,而且一旦进入网站,他们可能已经被站点管理员忽略了很长时间。

有些网站,甚至是包含大量文章的网站,都从未经过过拼写检查。 令人遗憾的是,在发布之前,它一直都不是每个人的首要任务。

但是,在发布大量帖子之后,稍后再进行拼写检查是一件很麻烦的事,因为您必须打开每个帖子,运行检查,修复需要的任何内容,然后保存。 (更不用说在文章或帖子中不能很好地显示的文本了,是吗?页脚文本和侧边栏模块/小部件呢?)

能够将一个人的所有网站内容都视为一个文档并对其进行拼写检查,不是吗?

我想了一会儿,并暂时考虑建立自己的东西来处理它。 但是,最后,我决定编写一个完整的拼写检查器可能比花掉我已经描述的无聊的一对一方法花费的时间更长。 所以,我放弃了。

但是,有一天,让我感到震惊的是,标准的Web浏览器具有内置功能,可以利用它来完成此任务-嗯,也许不是以完全自动化的方式,而是至少以一种可入侵的方式提供了帮助。

我说的是普通HTML中神奇的<textarea>字段。 通常会在大型注释框中遇到这种情况,例如您看到的HTML表单中包含较长的消息或注释字段。 是否曾经注意到过,如果您在其中之一中打错了打字,浏览器就会启动自己的拼写检查功能?

看到红色的波浪状? 那不是HTML。 来自网络浏览器!

那是一个“啊哈”的时刻,因为如果您将文章(无论是Wordpress,Joomla还是其他内容)加载到文本区域中,该文本区域将自动合并您浏览器的本机拼写检查功能。 (至少,这在我自己选择的浏览器Chrome中有效。)

作为拼写检查技巧,这为拼写检查Web内容开辟了一些非常酷的可能性。 我相信人们可以通过多种方式来利用它,从(1)一种简单而强大的方式来批量识别拼写错误,到(2)一种更复杂的识别和修复错误的方法。

快速/简便的方法:

在更简单的方面(仅用于标识),您将要做的是编写一个小脚本,一次遍历您想看的很多文本块,然后将各个字段转储到textareas中。 您的伪代码将类似于:

// go to your database and retrieve a custom recordset of various items you want to iterate through (e.g., a whole bunch of blog posts, and/or any other text-content from your site)
// iterate through the whole bunch, dumping the contents into textareas.
// It would probably be a good idea to identify these items with whatever identifying information would help you locate the items on your site (e.g., posting IDs or titles, or whatever).

从那里加载您的页面,然后您必须单击每个区域以进行激活。 错误会很容易被发现,因为它们会以漂亮的可见红色波浪线加下划线。

如果您没有看到错误,只需继续下一个。 如果确实看到错误,请右键单击并修复错误(通常适用于常见的拼写错误)。 然后,选择该文本区域内的所有内容,转到CMS,拉起该文章,然后粘贴固定的代码。

对于您无需做任何事情的每篇文章或帖子,您在这里节省的时间为1分钟。 换句话说,这为您节省了打开帖子,手动拼写检查,保存,在要查看的帖子列表中找到您的位置然后恢复的时间。

更复杂的方式:

尽管上述内容对于中小型网站很简单,但对于大型网站,您可能需要构建更强大的功能。 这样的伪代码将是这样的:

// go to your database and retrieve a custom recordset of various items you want to iterate through (e.g., a whole bunch of blog posts, and/or any other text-content from your site)
// iterate through the whole bunch, dumping the contents into textareas (perhaps even paginated).
// Instead of dumping contents only into textareas, you would rather generate entire forms, either bulk-forms by the page or individual forms by the item. (I'd probably do the latter.) That way, you could build in "save" buttons and actually save any changes you make right there.

当然,编写该脚本需要一些时间。 但是,对于一个足够大的站点,这笔投资是值得的。

这样说:如果每篇文章需要花费1分钟来拼写检查一个站点,并且您的站点有10,000篇文章,则需要166个小时的工作。 但是,如果通过上述方法每分钟可以获取5篇文章(不必打开,拼写检查,保存,关闭并跟踪堆栈中的位置),那么您的工作量将减少33.2小时,再加上4或5来编码此处描述的功能。

如果您的站点上有1,000篇文章,则仍然需要16.6个小时的手动工作,而这种新方式(计算代码)总共需要8个小时。 因此,假设您已经了解PHP,我估计成本效益分析可能在500多家文章网站附近。

我真的很喜欢这种想法,因为它在技术上适用于所有CMS以及这些CMS使用的扩展。 换句话说,您可以使用上述方法对网站上的所有文章进行拼写检查,然后对代码中的一些项目进行调整,然后对与该网站上待售的所有项目进行拼写检查,然后进行调整一些项目,并用它来拼写检查所有模块化内容,等等。

Jim Dee 在俄勒冈州波特兰市 领导 Array Web Development,LLC 他是《 网页设计师 》的编辑。 Web Developer 》杂志和许多在线出版物的撰稿人。 您可以通过ArrayWebDevelopment.com与Jim取得联系。 上面的照片是改编自 Ak〜i的 打字机 (Flickr,知识共享)。 如果喜欢(请单击下面的掌声图标), 收看本文,因为它确实有帮助。

From: https://hackernoon.com/programmatic-hack-idea-to-bulk-spell-check-sort-of-an-entire-web-site-52d5002a631e

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值