Office Spy DIY

Office Spy DIY

作者: 阿珊境界

针对不同应用程序进行内容监视和文本获取,网上介绍了不少,如针对聊天工具、Web页面等。今天,笔者和大家一起来DIY一个Office Spy,针对MS Office,利用其COM接口获取文本,保存其文档内容。

 

下载源代码

这里我们以MS Word为例进行叙述,其它Office组件可以触类旁通。OfficeCOM接口提供了_Application(应用程序)、Documents(所有文档)、Document(一个文档)、_Document(活动文档)、Selection(内容对象)等众多对象给我们使用。我们要做的获取文本、保存文档动作就是对这些对象的操作。好,知道了原理,下面开工。

程序框架

打开VC6,新建一个基于对话框的工程OfficeSpy,删除界面上原有的确定、取消按钮和静态文本标签,添加“获取文本”按钮(IDC_BTN_GETTEXT)、“保存文档”按钮(IDC_BTN_SAVEDOC)和一个编辑框(IDC_EDIT1),并选中其Multiline属性和Vertical Scroll属性。界面设计如图1

 

1

打开Class Wizard,点击下拉按钮Add Class,从下拉菜单中选择From a type LibraryWord2003的类型库文件名为Msword.olb,在诸如C:/Program Files/Microsoft Office/OFFICE11的文件夹下。Word2000的类型库文件名为Msword9.olb。选择类型库后,在接下来的Confirm Classes对话框中选择_Application_DocumentSelection三个类。如图2所示:

2

保留其缺省头文件名msword.h和源文件名msword.cpp。在引用这些对象的源文件中,需要包含该头文件。在使用这些对象之前,需要对其进行初始化,打开COffceSpyApp中的InitInstance()函数,在其中添加 AfxOleInit()语句即可。

获取文本

获取文本的大致步骤为:获取应用程序对象、活动文档对象、内容对象,获取文本成功后删除各对象指针。其代码如下:

void COfficeSpyDlg::OnBtnGettext()

{

       CLSID cs;

       HRESULT hr=::CLSIDFromProgID((LPCOLESTR)L"Word.Application",&cs); //ProgID得到CLSID

       if(hr!=S_OK)

       {

              MessageBox("你可能没有安装OFFICE");

              return;

       }

      

       IUnknown *pUnknown=NULL;

       IDispatch *pDispatch=NULL;

       _Application app=NULL;  //WORD对象

       Selection sel=NULL;   //内容对象

      

       hr=::GetActiveObject(cs,NULL,&pUnknown);

       if(hr!=S_OK)

       {

              MessageBox("没有WORD在运行。");

              return;

       }

       hr=pUnknown->QueryInterface(IID_IDispatch,(LPVOID *)&app);

       if(hr!=S_OK)

       {

              MessageBox("获取WORD接口指针失败。");

              return;

       }

       pUnknown->Release();

       pUnknown=NULL;

       sel=app.GetSelection();

       if(!sel)   

       {

              MessageBox("没有打开WORD文档。");

              return;

       }

      

       long start=sel.GetStart();  //取得插入点

       long end=sel.GetEnd();

       sel.WholeStory();                      //全部选择

       CString str=sel.GetText();         //取得文本

       sel.SetStart(start);   //恢复插入点

       sel.SetEnd(end);

       SetDlgItemText(IDC_EDIT1,str);

       if(pUnknown)

              pUnknown->Release();

       if(sel)    

              sel.ReleaseDispatch();

       if(app)   

              app.ReleaseDispatch();

}

保存文档

由上面的介绍,可以猜到保存文档是对_Docuent(当前活动文档)进行操作。查阅MSDN可知,_Document有个SaveAs成员函数,从字面上看大概就是它了。函数原形如下:

void SaveAs(VARINAT* FileName,

VARINAT* FileFormat,

VARINAT* LockComments,

VARINAT* Password,

VARINAT* AddToRecentFiles,

VARINAT* WritePassword,

VARINAT* ReadOnlyRecommended,

 VARINAT* EmbedTrueTypeFonts,

VARINAT* SaveNativePictureFormat,

VARINAT* SaveFormsData,

VARINAT* SaveAsAOCELetter)

数一数,11个参数,晕倒了吧?这些参数该如何设呢?我们可以助VBA。打开任一篇Word文档,选择菜单工具//录制新宏,等宏录制工具栏出现后,选择菜单文件/另存为,文件名设为abcde.doc。停止宏录制,查看宏代码,如下:

ActiveDocument.saveas FileName:="abcde.doc", _

FileFormat:=wdFormatDocument, _

LockComments:=False, _

Password:="", _

AddToRecentFiles:=True, _

WritePassword :="", _

ReadOnlyRecommended:=False, _

EmbedTrueTypeFonts:=False, _

SaveNativePictureFormat:=False, _

SaveFormsData:=False, _

SaveAsAOCELetter:= False

不难发现,VBASaveAs11个参数和COM接口对象_DocumentSaveAs11个参数是一一对应的。为了方便操作VARIANT类型变量,使用 CComVariant 模板类,所以要在OfficeSpyDlg.cpp文件中包含atlbase.h文件。本工程另存DOC”按钮的代码如下:

void COfficeSpyDlg::OnBtnSavedoc()

CString szFilter="MS Word files|*.doc|All files|*.*||";

CFileDialog dlg(FALSE,"","",0,szFilter,NULL);

if(IDCANCEL==dlg.DoModal ())

         return;

CString strFileName=dlg.GetPathName();

……//引用COM接口代码与获取文本部分相同,此处省略

_Document doc=app.GetActiveDocument();

//初始化下列参数时的子参数何来?可以录制一段VBA宏而来

CComVariant FileName(_T(strFileName)),FileFormat(0);

CComVariant LockDocuments(false),Password=_T("");

CComVariant AddToRecentFiles(false),WritePassword(_T(""));

CComVariant ReadOnlyRecommended(false),EmbedTrueTypeFonts(false);

CComVariant SaveNativePictureFormat(0),SaveFormsData(false),SaveAsAOCELetter(false);

CComVariant encoding(0),InsertLineBreaks(0),AllowSubstitutions(0);

CComVariant LineEnding(0),AddBiDiMarks(0);

doc.SaveAs (&FileName,&FileFormat,&LockDocuments,&Password,&AddToRecentFiles,&WritePassword,

              &ReadOnlyRecommended,&EmbedTrueTypeFonts,&SaveNativePictureFormat,

              &SaveFormsData,&SaveAsAOCELetter);

if(pUnknown) pUnknown->Release();

if(sel)     sel.ReleaseDispatch();

if(doc) doc.ReleaseDispatch();

if(app)    app.ReleaseDispatch();

}

结束语

  Office COM接口提供给我们的功能远不止这些,用它还可以实现文本输入、表格绘制、图形绘制、文档打印、设置密码等Office原有的大部分功能。此文只作抛砖引玉,撰写过程中参考了 杨 老师的相关技术资料,特此鸣谢。代码在Window XP + VC6.0中调试通过。欢迎访问我的个人主页http://www.asanscape.com,欢迎加入我们的VC讨论群713035

 
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值