任务:
完成一个反作弊的网络程序(或单机版的.exe),能够在多篇文本的作业中识别出最相似的若干对文本。
进度:
借助MD5,初步实现了两篇文档的相似度检验;
完成K均值聚类的实现;
目标:
MD5的速度很慢,所以在完成原型的实现后,要进一步更新算法;
实现聚类以及最后结果的输出;
实现软件的.exe以及网络版。
最近正在解决的是多线程的问题,想在文档录入以及转码过程中实现多线程
关于thread,参考了:
http://www.albahari.com/threading/
感觉很不错~