C#处理WORD,WORD数据入库

 最近一个朋友让我帮他做一个小功能,其实就是把WORD文档里的内容存到数据库里去,可以实现搜索并转EXCEL的功能,需求很简单,想不到加上部署折腾了我一个星期,我先把需求详细描述一下:

      提供一个WORD文档的样板,这个WORD文档里大部分是文本,其中插入了一个EXCEL表格,WORD的内容如下:

 

房地产价值监证确认书

 

                     编号:(2009交)价确字第   号

  邓征兵   

根据您的委托,我单位派遣专业评估人员对位于  大祥区翠园      的房地产(《房屋所有权证》)号为 0013210 ,房屋所有权人  邓文兵    房屋所在层次/总层数  6 / 8 ,进行了现场勘估。

评定估价对象房屋的结构等级为    砖混       ,建成年代为 90年代末    ,成新度为   9成    

确认房屋价值如下表:

这里有个EXCEL表格

监证目的:交易课税

 

备注:                                                    

                                                       

邵阳市房产产权监理处价格管理科

现场评估:黄生忠

审    批:

                                 2009 年 2 月 10 日

就是把这个文件中相关内容存入数据库,同时要能够实现查询,比如根据委托人查询,同时要把查询的结果能转EXCEL。

功能就是这样的,先把其中用到的技术点挑出来,

一读WORD里的内容,这个并不难;

 


Microsoft.Office.Interop.Word.ApplicationClass wordApp  =   new  Microsoft.Office.Interop.Word.ApplicationClass();
            
object  file  =  nam;
            
object  nullobj  =  System.Reflection.Missing.Value;
            
try
            {
                Microsoft.Office.Interop.Word.Document doc 
=  wordApp.Documents.Open(
                
ref  file,  ref  nullobj,  ref  nullobj,
                
ref  nullobj,  ref  nullobj,  ref  nullobj,
                
ref  nullobj,  ref  nullobj,  ref  nullobj,
                
ref  nullobj,  ref  nullobj,  ref  nullobj,  ref  nullobj,  ref  nullobj,  ref  nullobj,  ref  nullobj);

                
// doc.ActiveWindow.Selection.WholeStory();
                
                
// doc.ActiveWindow.Selection.Copy();

                
// IDataObject data = Clipboard.GetDataObject();
                
                fileContent 
=  doc.Content.Text;    // 这里读取所有的WORD里的文本             
}

 

二读WORD文件里EXCEL里的数据,这个是比较困难的,我试了很多方式,也没有查到相关的资料,最后在国外论坛上看见了VB的代码,然后修改了一下,可以用;

 


foreach  (Microsoft.Office.Interop.Word.InlineShape ish  in  doc.InlineShapes)
                {
                    
if  (ish.Type  ==  Microsoft.Office.Interop.Word.WdInlineShapeType.wdInlineShapeEmbeddedOLEObject)
                    {
                        
if  (ish.OLEFormat.ProgID  ==   " Excel.Sheet.8 " )
                        {
                            
// ish.OLEFormat.DoVerb(ref nullobj);

                            ish.OLEFormat.Activate();
                            Microsoft.Office.Interop.Excel.Workbook objEXl 
=  (Microsoft.Office.Interop.Excel.Workbook)ish.OLEFormat.Object;
                            buildArea 
=  ((objEXl.Worksheets[ 1 as  Microsoft.Office.Interop.Excel.Worksheet).Cells[ 2 2 as  Microsoft.Office.Interop.Excel.Range).Text.ToString();
                            
if  (buildArea  !=   "" )
                            {
                                buildUnitPrice 
=  ((objEXl.Worksheets[ 1 as  Microsoft.Office.Interop.Excel.Worksheet).Cells[ 2 3 as  Microsoft.Office.Interop.Excel.Range).Text.ToString();
                                buildCountPrice 
=  ((objEXl.Worksheets[ 1 as  Microsoft.Office.Interop.Excel.Worksheet).Cells[ 2 4 as  Microsoft.Office.Interop.Excel.Range).Text.ToString();
                                userKind 
=   " 住宅 " ;
                            }
                            
else
                            {
                                buildArea 
=  ((objEXl.Worksheets[ 1 as  Microsoft.Office.Interop.Excel.Worksheet).Cells[ 3 2 as  Microsoft.Office.Interop.Excel.Range).Text.ToString();
                                buildUnitPrice 
=  ((objEXl.Worksheets[ 1 as  Microsoft.Office.Interop.Excel.Worksheet).Cells[ 3 3 as  Microsoft.Office.Interop.Excel.Range).Text.ToString();
                                buildCountPrice 
=  ((objEXl.Worksheets[ 1 as  Microsoft.Office.Interop.Excel.Worksheet).Cells[ 3 4 as  Microsoft.Office.Interop.Excel.Range).Text.ToString();
                                userKind 
=   " 非住宅 " ;
                            }                            
                            objEXl.Application.Quit();                            
                        }
                    }
                }

 

三正则表达式的应用,我要获取比如邓征兵这个委托人,我不可能用SUBSTRING来取数据吧,这样效果太低了;

 


Regex reg1  =   new  Regex( " [/u4E00-/u9FFF]+ " , RegexOptions.IgnoreCase);
                userName 
=  reg1.Match(doc.Paragraphs[ 4 ].Range.Text).Value.Trim(); // 委托人
                Regex reg2  =   new  Regex( " 评估人员对位于([//S|//s]+)的房地产 " , RegexOptions.IgnoreCase);
                HouseAddr 
=  reg2.Match(fileContent).Groups[ 1 ].Value.Trim(); // 房子地址doc.Paragraphs[5].Range.Text
                Regex reg3  =   new  Regex( " 号为([//S|//s]+),房屋所有权人 " , RegexOptions.IgnoreCase);
                propertyNo 
=  reg3.Match(fileContent).Groups[ 1 ].Value.Trim(); // 房产证号doc.Paragraphs[5].Range.Text
                Regex reg4  =   new  Regex( " 房屋所有权人([//S|//s]+)房屋所在层次 " , RegexOptions.IgnoreCase);
                propertyUser 
=  reg4.Match(fileContent).Groups[ 1 ].Value.Trim(); // 房屋所有权人doc.Paragraphs[5].Range.Text
                Regex reg5  =   new  Regex( " 层次/总层数([//S|//s]+),进行了现场勘估 " , RegexOptions.IgnoreCase);
                buildCount 
=  reg5.Match(fileContent).Groups[ 1 ].Value.Trim(); // 层次/总层数doc.Paragraphs[5].Range.Text
                Regex reg6  =   new  Regex( " 建成年代为([//S|//s]+),成新度为 " , RegexOptions.IgnoreCase);
                buildYear 
=  reg6.Match(fileContent).Groups[ 1 ].Value.Trim(); // 建成年代doc.Paragraphs[6].Range.Text
                Regex reg7  =   new  Regex( " 现场评估:([//S|//s]+)审 " , RegexOptions.IgnoreCase);
                evaluateUser 
=  reg7.Match(fileContent).Groups[ 1 ].Value.Trim(); // 现场评估doc.Paragraphs[13].Range.Text
                Regex reg8  =   new  Regex( " [//d|//s]+年[//d|//s]+月[//d|//s]+日 " , RegexOptions.IgnoreCase);
                evaluateDate 
=  reg8.Match(fileContent).Value.Trim(); // doc.Paragraphs[15].Range.Text.Trim()时间

四转EXCEL,网上很多人都是用datagrid直接转EXCEL,这样只能倒出第一页的数据,不适合我的程序;

 

 


DataTable dt  =  GetAllData();
        StringWriter sw 
=   new  StringWriter();
        sw.WriteLine(
" 序号/t委托方/t产权人/t产权证号/t房屋座落/t建筑面积(平方米)/t建成年代/t层次/层数/t使用性质/t评估单价(元/平方米)/t评估总价值(元)/t现场评估人员/t评估日期/t备注 " );

        
if  (dt  !=   null )
        {
            
foreach  (DataRow dr  in  dt.Rows)
            {
                sw.WriteLine(dr[
" id " +   " /t "   +  dr[ " userName " +   " /t "   +  dr[ " propertyUser " +   " /t "   +  dr[ " propertyNo " +   " /t "   +
                    dr[
" HouseAddr " +   " /t "   +  dr[ " buildArea " +   " /t "   +  dr[ " buildYear " +   " /t "   +  dr[ " buildCount " +   " /t "   +
                    dr[
" userKind " +   " /t "   +  dr[ " buildUnitPrice " +   " /t "   +  dr[ " buildCountPrice " +   " /t "   +  dr[ " evaluateUser " ]
                    
+   " /t "   +  dr[ " evaluateDate " +   " /t "   +   "" );
            }
        }
        sw.Close();
        Response.AddHeader(
" content-disposition " " attachment; filename=MyExcelFile.xls " );
        Response.ContentType 
=   " application/excel " ;
        Response.ContentEncoding 
=  System.Text.Encoding.GetEncoding( " GB2312 " );
        Response.Write(sw);
        Response.End();

五,KILL进程,我在查看WORD里EXCEL里的数据的时候,无法关闭EXCEL,需要用程序来关闭;

 


public   void  KillProcess( string  processName)
    {
        System.Diagnostics.Process myproc 
=   new  System.Diagnostics.Process();
        
// 得到所有打开的进程  
         try
        {
            
foreach  (Process thisproc  in  Process.GetProcessesByName(processName))
            {
                
if  ( ! thisproc.CloseMainWindow())
                {
                    
if  (thisproc  !=   null )
                        thisproc.Kill();
                }
            }
        }
        
catch  (Exception Exc)
        {
            
throw  Exc;
            
//  msg.Text+=  "杀死"  +  processName  +  "失败!";  
        }
    } 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值