关闭

java读取pdf文件

标签: javanullstringcmd
1210人阅读 评论(4) 收藏 举报
方法很简单,利用著名的Runtime.getRuntime()即可,如下:
    /**
     * 
@param filePath  pdf文件路径
     * 
@return
     
*/

    
public String getPdfContent(String filePath){
        String excute
="pdftotext";

        String[] cmd
=new String[]{excute, "-enc""UTF-8""-q", filePath,"-"};
        Process p
=null;
        
try {
            p
=Runtime.getRuntime().exec(cmd);
        }
 catch (IOException e) {
            e.printStackTrace();
        }


        BufferedInputStream bis
=new BufferedInputStream(p.getInputStream());

        InputStreamReader reader
=null;

        
try {
            reader
=new InputStreamReader(bis,"UTF-8");
        }
 catch (UnsupportedEncodingException e1) {
            e1.printStackTrace();
        }


        StringBuffer sb
=new StringBuffer();

        
try {
            BufferedReader br 
= new BufferedReader(reader);
            String line 
= br.readLine();            
            sb 
= new StringBuffer();
            
while (line != null{
                sb.append(line);
                sb.append(
" ");
                line 
= br.readLine();
            }

        }
 catch (Exception e) {
            e.printStackTrace();
        }

        
        
return sb.toString();
    }
 
0
0

猜你在找
【直播】机器学习&数据挖掘7周实训--韦玮
【套餐】系统集成项目管理工程师顺利通关--徐朋
【直播】3小时掌握Docker最佳实战-徐西宁
【套餐】机器学习系列套餐(算法+实战)--唐宇迪
【直播】计算机视觉原理及实战--屈教授
【套餐】微信订阅号+服务号Java版 v2.0--翟东平
【直播】机器学习之矩阵--黄博士
【套餐】微信订阅号+服务号Java版 v2.0--翟东平
【直播】机器学习之凸优化--马博士
【套餐】Javascript 设计模式实战--曾亮
查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:49206次
    • 积分:682
    • 等级:
    • 排名:千里之外
    • 原创:4篇
    • 转载:40篇
    • 译文:1篇
    • 评论:11条
    文章分类
    最新评论