1. 需求:需要检测pdf文档里面的内容(目前只需要判定文字)与文档边缘的距离,要保证有一定的距离,为了方便裁切时不会把内容裁切掉;
2. 解决思路:首先得到一个将pdf宽高去掉了指定距离的矩形,然后判定文字的坐标是否在这矩形内,如果坐标完全在矩形内,则表示文字符合要求,否则文字就是挨着边缘太近,不符合要求。
3. 解决方法:使用第三方插件itextpdf,查看源码发现有一个TextRegionEventFilter类可以使用,自定义一个类继承此类,覆盖里面的accept(IEventData data, EventType type)方法,在此方法中加入自己的代码。
自定义的类代码如下:
package PdfCheck.Util;
import java.util.ArrayList;
import java.util.List;
import com.alibaba.druid.util.StringUtils;
import com.itextpdf.kernel.geom.LineSegment;
import com.itextpdf.kernel.geom.Rectangle;
import com.itextpdf.kernel.geom.Vector;
import com.itextpdf.kernel.pdf.canvas.parser.EventType;
import com.itextpdf.kernel.pdf.canvas.parser.data.IEventData;
import com.itextpdf.kernel.pdf.canvas.parser.data.TextRenderInfo;
import com.itextpdf.kernel.pdf.canvas.parser.filter.TextRegionEventFilter;
public class TextDistanceWithBorderEventFilter extends TextRegionEventFilter{
private Rectangle filterRect;
public TextDistanceWithBorderEventFilter(Rectangle filterRect) {
super(filterRect);
this.filterRect = filterRect;
}
private List<String> texts = new ArrayList<>();
@Override
public boolean accept(IEventData data, EventType type) {
if (type.equals(EventType.RENDER_TEXT)) {
TextRenderInfo renderInfo = (TextRenderInfo) data;
if(!StringUtils.isEmpty(renderInfo.getText())) {
String text = renderInfo.getText();
LineSegment segment = renderInfo.getBaseline();
LineSegment segmengtAsc = renderInfo.getAscentLine();
//文字的左下角坐标
Vector startPoint = segment.getStartPoint();
//文字的右上角坐标
Vector topRight = segmengtAsc.getEndPoint();
float x1 = startPoint.get(Vector.I1);
float y1 = startPoint.get(Vector.I2);
float x2 = topRight.get(Vector.I1);
float y2 = topRight.get(Vector.I2);
//检测文字是否符合指定边距的条件
if(intersectsAndGreateWithBorder(x1, y1, x2, y2)) {
texts.add(text);
}
return intersectsAndGreateWithBorder(x1, y1, x2, y2);
}else {
return false;
}
} else {
return false;
}
}
public List<String> getTexts(){
return texts;
}
private boolean intersectsAndGreateWithBorder(float x1, float y1, float x2, float y2) {
double rx1 = filterRect.getX();
double ry1 = filterRect.getY();
double rx2 = rx1 + filterRect.getWidth();
double ry2 = ry1 + filterRect.getHeight();
//文字坐标完全在矩形区域内
boolean includeAll = (rx1 < x1 && x1 < rx2 && ry1 < y1 && y1 < ry2) &&
(rx1 < x2 && x2 < rx2 && ry1 < y2 && y2 < ry2);
return (!includeAll) ;
}
}