用某软件获取到一些某文库数据,但该数据中有很多是重复的,现在需要得到无重复,并且按下载量降序排列的数据,那我们应如何做呢?
![495b887ae0f7d860ffd2fb56b7f76021.png](https://i-blog.csdnimg.cn/blog_migrate/c5406edabfa54b50e404974dabe6469e.jpeg)
1、鼠标选中某中一个单元格,然后选择“数据/删除重复项”,在出现的对话框中啥也不选,直接点击确定。
![38dca04e5b53b5c452f36a5de5d7da25.png](https://i-blog.csdnimg.cn/blog_migrate/c5137f4267a0b80a6c93e3817f7c4638.jpeg)
2、系统会将重复数据删除掉,并提示删除了多少条。这里的删除重复是指每一列的值都是一样的就算是重复的。
![eeb8968f6a1584111349e3cad8fc1db3.png](https://i-blog.csdnimg.cn/blog_migrate/5bb2247c4c81387cdaf7e195697c8a8c.jpeg)
3、但光是这样还并没有去除完整,我们再次点击“删除重复项”,在对话框中点“取消全选”,然后再在列框中选择“简介”,那么只要简介是一样的就算是重复项。
![64b75f4be60ec5f2d47a54579a78f3d3.png](https://i-blog.csdnimg.cn/blog_migrate/2e07734c5e564411a740f19402d7928c.jpeg)
4、经过上述步骤,可能还没有删除完重复数据,因为有些简介内容长短不一样,即使是重复的,但由于长度不同,系统也会判定为不重复,那这时我们就要将每个简介都只截取固定长度来进行对比。
5、我们在新的列,使用如下公式:
=LEFT(F2,10)
或者:
=MID(F2,1,10)
注:这样我们就只取10个字符,MID函数的第2个参数是指起始位置,是从1开始的,不是从0开始,如果输入为0会出现错误。
![5ffe0caace1fe69b8dc0b2855f6c8ed5.png](https://i-blog.csdnimg.cn/blog_migrate/8e73e4cefd41669165d739e43140bee2.jpeg)
6、对K列所有单元格应该上述公式,得到长度统一的简介,对现有数据再次像第3步中那样应用“删除重复项”,只是这次要选中“截取后的简介”。
![c7fa466187e7d7c2514903b658133579.png](https://i-blog.csdnimg.cn/blog_migrate/dd59c51206cf19226ae84090b28b8335.jpeg)
7、这样就又去除掉了一些重复的项。
![6672989963dc6d9d89e0445866718958.png](https://i-blog.csdnimg.cn/blog_migrate/46244e57f8889c54995c359245995566.jpeg)
8、去重以后,我们再对下载量应用降序排列,那么最后就得到了我们想要的结果了。
![d06a97c0d6ca5d2c2c0b4f5b410dcd63.png](https://i-blog.csdnimg.cn/blog_migrate/19e92ecc610bb6aca404f2b0d66ca131.jpeg)