发现抄袭
随着电子与信息技术的飞速发展,写文章变得越来越容易(因为可以拷贝粘贴)。为了防止文章中过度的抄袭现象,发扬原创精神,本程序意在能发现A文章(a.txt中)是否抄袭了B文章(b.txt中)。
我们规定:有20个连续相同的字符,就有抄袭的嫌疑。
程序对a.txt, b.txt的内容进行比对,发现a.txt中貌似抄袭的所有位置。要求列出疑似抄袭的内容、该内容在a.txt中的位置(第几个字符)、该内容在b.txt中位置。
注意:如果A文把B文中的同一句话在A文中多次使用,只要找到第一个位置即可。
当雷同内容超过20个字符,只列出最开始的20个字符,并不计算为多处。
本程序只适用于文章不是很大的情况,对于长达几百兆的文章则需要更复杂的处理技巧,不是本程序的需求范围。