需求描述:
两个文本,A、B检测A中的测点是否都在B 内存在。A约有7000个测点,B约有50000个测点。
实现过程:
1.将2个文本进行去重处理,得到A1,B1.
2.将A1,B1合并为C。
3.将C与B1做差集(List),得到文本D,其中D就是B中不包含A的测点
数据说明:
文件名称 | 7000.txt | 50000.txt |
原始行数 | 7389 | 48129 |
去重后行数 | 7331 | 48029 |
将两个文件合并 | ||
合并后行数 | 55359 | 生成文本5+7.txt |
合并并且去重 | 53476 | 说明B包含A的1883个点 |
将5+7.txt与50000.txt做差集 | 5448 | 输出B中没有的5448个点 |
注:去重复用hashset做,做差集使用list做。