IE下VC与JavaScript交互

顺其自然~

于 2021-05-08 11:32:01 发布

阅读量466

点赞数

文章标签： IE BHO

原文链接：https://blog.csdn.net/charlessimonyi/article/details/50984903

版权

为什么要让VC与JavaScript交互？

1、有时候我们需要让自己的软件打开一个网页，来获取页面上的一些数据。这时，可以用mshtml解析HTML提取出数据，也可以向HTML文档动态写入我们准备好的JS代码，用JS代码获取HTML上的数据，然后用VC调用该JS代码取得数据。

2、有时候我们需要让自己的软件打开一个网页并操控该网页，填写表单，提交等动作。这时，可以用mshtml操作HTML，给文本框赋值，模拟点击按钮。也可以向HTML文档动态写入我们准备好的JS代码，用JS代码实现填单，提交等动作，然后用VC调用一下JS代码即可。

3、有时候我们需要用HTML网页做界面，用JS管理HTML页面，用VC调用JS传递进数据，JS把这些数据通过HTML显示在界面上。CHtmlDialog正是这种产物。

4、有时候我们需要基于HTTP协议与WEB服务器直接交互。比如基于HTTP协议来登录QQ空间。但是对浏览器抓包发现QQ号是明文传输，但QQ密码是密文，它是如何加密的呢？这些加密算法肯定都在页面上的JS里，因为这个加密过程是在客户浏览器上实现的。我们可以找到加密相关的JS代码，仔细阅读分析，改写为C++代码实现，但比较复杂。一个简单的办法就是直接把这些用于加密的JS代码复制出来，用VC调用JS代码，让它的JS代码完成加密过程，然后我们把密文拿过来，用HTTP协议POST发送到WEB服务器，即完成了登陆动作。

5、等等，还有很多用途。

那么，在Windows平台上用VC开发的程序，如何与JavaScript交互？

通常，我们都是用WebBrowser加载包含JS代码的HTML，然后通过WebBrowser对象获取IHTMLDocument接口(对于ActiveX的WebBrowser来说是get_Document方法，对于CHtmlView对象来说是GetHtmlDocument方法)。其中IHTMLDocument2接口有一个get_Script方法，可以获取用于控制JS代码的IDispatch接口。VC调用JS函数，都是通过这个IDispatch接口的Invoke方法来完成。使用IDispatch接口的GetIDsOfNames方法根据JS函数名获取调度标识符DISPID，使用Invoke来调用JS函数。Invoke最后两个参数用于返回错误信息，可为NULL。这个IDispatch接口调用起来很麻烦，下文将会介绍如何简便的调用。网上有个外国人写了个CWebPage类实现VC与JS交互，用的正是这种方法。

http://www.codeproject.com/Articles/2352/JavaScript-call-from-C

关于WebBrowser：

在VC中使用WebBrowser，一般有两种方法。MFC中有个CHtmlView封装了WebBrowser，用起来很方便。虽然CHtmlView派生于CView，是个视图类，但它也派生于CWnd，将其用于对话框上，完全没有问题，只是在某些地方需要小修改一下。其中需要注意的两个问题就是：

1. CHtmlView的构造函数是protected的，不允许直接构造一个CHtmlView对象。必须从CHtmlView派生后再构造。

2.如果是在栈上创建CHtmlView对象，必须重载PostNcDestroy并什么也不写。因为默认的PostNcDestroy会delete this;而出错。如果是在堆上创建CHtmlView对象则要注意防止二次delete。

另一种方法是使用WebBrowser的ActiveX控件，这种方法可以在MFC项目中使用，也可以在非MFC项目中使用。

关于IDispatch：

我们知道IDispatch是COM双接口中的调度接口。一般用于供脚本语言调用COM组件。对于编译型的C++语言，让它调用这种接口，是很麻烦的。毕竟用IDispatch接口调用COM对象的各种方法、设置与获取COM对象的属性、让COM对象回调我们，都是用IDispatch的Invoke方法来实现。一个Invoke就要实现那么多功能，用起来当然很麻烦。不过好在ATL智能指针类中的CComDispatchDriver(即CComQIPtr<IDispatch>)封装了IDispatch接口，使用我们用起来大大的方便！CComDispatchDriver对GetIDsOfNames和Invoke进一步进行了封装，只需更少的参数即方便可调用。

获取和设置COM对象属性可以用CComDispatchDriver的这些方法：

GetProperty

GetPropertyByName

PutProperty

PutPropertyByName

其实使用IDispatch调度接口来设置、获取COM属性，调用COM方法，都是使用GetIDsOfNames和Invoke。实际上这四个方法都是对GetIDsOfNames和Invoke的封装。简化调用的复杂性。

调用COM对象的方法可以用这些方法：

Invoke0 //调用0个参数的方法

Invoke1 //调用1个参数的方法

Invoke2 //调用2个参数的方法

InvokeN //调用多个参数的方法

这些函数都有两个版本，一个是接受调度标示符DISPID，需要自己先调用GetIDsOfNames来获取。一个是接受OLE字符串的版本，这个版本在内部会调用GetIDsOfNames来获取DISPID。这些函数用起来很方便，不需要我们自己填充DISPPARAMS结构，但是它对原始Invoke的调用时，最后两个参数都是NULL，即不需要获取错误信息。如果需要获取错误信息，我们需要自行调用原始Invoke方法。

注意，这些方法是ALT的CComDispatchDriver封装的方法，调用时应使用"."而不是"->"。因为"->"获得的是CComDispatchDriver内部的Dispatch指针。

另一个要注意的问题是，一定要等Navigate完全加载一个html文档后（触发OnDocumentComplete），才能获取IHTMLDocument2和Script。否则会出现空指针或找不到JS函数。所以不能在调用Navigate打开HTML后就紧接着获取IHTMLDocument2和Script，要等HTML文档加载完。

上面说了这么多COM对象，和VC调用JS有什么关系？别忘了我们用IHTMLDocument2接口的get_Script方法获取到了代表HTML文档中JS代码的IDispatch接口，我们用IDispatch接口，把HTML文档中的这堆JS代码当作一个COM对象，来操控它。上面说的Invoke0,Invoke1,Invoke2,InvokeN，正是分别被我们用来调用0个参数的JS函数，1个参数的JS函数，2个参数的JS函数，N个参数的JS函数。

说了那么多，下一篇文章，让我们来实际动手，用VC调用一下JS函数看看。

当初为了写自动打开网页，自动填单，自动提交的小程序，看了一下这方面的东西，由于当时只涉及到了VC调用JavaScript，没有涉及到JavaScript调用VC，所以也没有花时间去深入了。这两年期间，好几次想把 VC与JavaScript交互(三) 写出来，可是发现这个东西实在是太麻烦，太复杂，看不透，剪不断，理还乱，抽刀断水水更流，举杯消愁愁更愁。代码写出来以后我总是怀疑是不是搞错了，感觉是不是走了弯路，直到今天我仍然怀疑是不是有更好更简单的办法来实现JS调用C++。为什么说它非常麻烦和复杂，可以看这里http://dgj0600.blog.163.com/blog/static/440604322012102325015495/
这是网上找到的一段JS调用C++的代码，密密麻麻的，根本不知道该怎么把它解释清楚。

实际上关于VC与JavaScript交互，最熟悉它的人应该是开发Activex控件及IE的BHO插件的程序员，他们一定能讲清楚其中的原理，讲清楚每一个API和接口的用法。不过搞这些的人越来越少了，现在WEB上的Activex控件也是越来越少了，关于ATL的书都在10年前就绝版了，可想而知现在还有多少人研究这个东西。

吐槽WebBrowser：

WebBrowser这个东西真是让人爱又让人恶心，刚开始使用觉得挺简单的，导航、刷新、前进、后退、获取其中的HTML，都还比较易用，很快就爱上了它。但稍微深入后便发现了这种闭源软件的弊端，难以扩展和改造！比如要用WebBrowser开发一个多进程浏览器，如何在进程间共享Cookie。比如要针对不用的URL设置不同的HTTP代理来访问。比如要让它支持需要用户名密码验证的HTTP/SOCKS5代理等。WebBrowser根本没有提供这种接口来实现这些功能，只能是通过API Hook等办法来实现，既麻烦又不稳定可靠。而且WebBrowser这个东西还非常慢，本来IE就已经够慢了，WebBrowser作为IE的简化版，当它嵌入到我们的程序中时，WebBrowser中的HTML排版、渲染引擎、JavaScript解释器居然都是运行在我们程序的主线程（UI线程）中！所以你可以发现，如果WebBrowser加载一个内容非常多，非常复杂的页面时，在加载期间，你的程序就像假死了一样，同样如果HTML页面上的JavaScript代码在进行繁杂的运算时，你的程序界面又假死了。因为你的UI线程在运行JS解释器，你的UI线程在解释JavaScript代码并执行，在那期间它抽不出来空来去处理Windows消息循环，便假死了。

点赞CEF：

在此强烈推荐CEF（Chromium Embedded Framework），即Chromium版的WebBrowser。Chromium就不用说了，它的快是非常出名的，即便作为控件来使用，CEF也运用了多进程技术，HTML的渲染和JavaScript的解释执行都是在格外的进程中，不会影响你的UI线程，奔溃了也不会破坏你的进程。而且CEF是用C++写的，对外提供的原生接口就是C++接口，比起WebBrowser的那套COM接口来说不知道好用多少倍。

JavaScript调用C++的一个相对简单的实现：

简述：
上一章说到，一个 JavaScript对象传到了C++这边以后，就变成了一个IDispatch*，然后我们用CComDispatchDriver接管这个IDispatch*后，就可以调用这个JavaScript对象的方法，获取这个JavaScript对象的属性，实际上CComDispatchDriver就是对IDispatch的包装，最终都是调用IDispatch::Invoke。同理，如果我们在C++这边构造出一个IDispatch*并传递给JavaScript，那么JavaScript就可以把这个IDispatch*当做一个JavaScript对象来使用，自然它就可以调用这个对象的方法，修改这个对象的属性，最终就可以实现调用C++函数，修改C++对象的成员变量，实际上JavaScript调用C++也是通过IDispatch::Invoke来调用。那么如何构造这个IDispatch就是问题的关键点。

实现：
直接上代码，首先我建的是一个MFC对话框项目，WebBrowser已经拖上去了，添加为成员变量 m_webbrowser。然后修改MFC为我们生成的对话框类CxxDlg（我的项目名为JsCallCpp，所以我的示例代码中就是CJsCallCppDlg）：

class CJsCallCppDlg : public CDialogEx, public IDispatch
{
...
}

将其多重继承于IDispatch。啊！多重继承？怎么把这种坑爹的东西搞出来？NO NO NO，不要谈多重继承就色变，这里的IDispatch里面的所有成员函数都是纯虚函数，本质上IDispatch就是个接口，C++的实现接口的方式就是多重继承，虽然不鼓励用多重继承来继承实现代码，但是像这样用来实现接口是面向对象中非常常用的。当然你也可以class MyIDispatch : public IDispatch，然后把MyIDispatch实例化成一个对象后传递给 JavaScript来调用。这里之所以用CxxDlg来实现IDispatch，是为了方便，因为待会儿，我只要把CxxDlg的this指针传递给JavaScript，它就可以调用我的CxxDlg从IDispatch处继承来的虚函数Invoke，也就是说JavaScript就可以直接调用CxxDlg::Invoke，然后在CxxDlg::Invoke中可以很方便的调用我CxxDlg的其它成员函数。
然后我写下了如下的HTML文件：

<html>
<head>
    <meta charset="utf-8" />
    <title></title>
    <script language="javascript">
        function ShowMessageBox()
        {
            if (cpp_object != null)
                cpp_object.ShowMessageBox("你好，我是Javascript，你是谁？");
        }
        function GetProcessID()
        {
            if (cpp_object != null)
            {
                var id = cpp_object.GetProcessID();
                document.getElementById("process_info").innerText = "本进程ID为：" + id;
            }
        }
        function SaveCppObject(obj)
        {
            cpp_object = obj;
        }
        var cpp_object;
    </script>
</head>
<body>
    <p id="process_info"></p>
    <button type="button" οnclick="ShowMessageBox()">MessageBox</button>
    <button type="button" οnclick="GetProcessID()">Process ID</button>
</body>
</html>

然后我在我的 CxxDlg里写下了如下的两个成员函数：

DWORD CJsCallCppDlg::GetProcessID()
{
    return GetCurrentProcessId();
}
 
void CJsCallCppDlg::ShowMessageBox(const wchar_t *msg)
{
    MessageBox(msg, L"这是来自javascript的消息");
}

接来下，我要用HTML中的这两个按钮，分别调用这两个C++函数，其中一个是ShowMessageBox，让Javascript调用它并传递一个字符串给它，最终C++这边通过Windows API的MessageBox实现弹出一个消息框。另外一个是GetProcessID，Javascript调用它，最终C++这边通过Windows API的GetCurrentProcessId()获取本进程ID，并给Javascript返回这个ID值，然后显示到HTML中。

由于我的CxxDlg继承了IDispatch，那么我需要实现IDispatch中的七个纯虚函数，所以在CxxDlg类的声明中添加如下七个虚函数的声明：

virtual HRESULT STDMETHODCALLTYPE GetTypeInfoCount(UINT *pctinfo);
virtual HRESULT STDMETHODCALLTYPE GetTypeInfo(UINT iTInfo, LCID lcid, ITypeInfo **ppTInfo);
virtual HRESULT STDMETHODCALLTYPE GetIDsOfNames(REFIID riid, LPOLESTR *rgszNames, UINT cNames, LCID lcid, DISPID *rgDispId);
virtual HRESULT STDMETHODCALLTYPE Invoke(DISPID dispIdMember, REFIID riid, LCID lcid, WORD wFlags, DISPPARAMS *pDispParams, VARIANT *pVarResult, EXCEPINFO *pExcepInfo, UINT *puArgErr);
virtual HRESULT STDMETHODCALLTYPE QueryInterface(REFIID riid, void **ppvObject);
virtual ULONG STDMETHODCALLTYPE AddRef();
virtual ULONG STDMETHODCALLTYPE Release();

然后实现这七个虚函数：

//我自己给我的两个函数拟定的数字ID，这个ID可以取0-16384之间的任意数
enum
{
    FUNCTION_ShowMessageBox = 1,
    FUNCTION_GetProcessID = 2,
};
 
//不用实现，直接返回E_NOTIMPL
HRESULT STDMETHODCALLTYPE CJsCallCppDlg::GetTypeInfoCount(UINT *pctinfo)
{
    return E_NOTIMPL;
}
 
//不用实现，直接返回E_NOTIMPL
HRESULT STDMETHODCALLTYPE CJsCallCppDlg::GetTypeInfo(UINT iTInfo, LCID lcid, ITypeInfo **ppTInfo)
{
    return E_NOTIMPL;
}
 
//JavaScript调用这个对象的方法时，会把方法名，放到rgszNames中，我们需要给这个方法名拟定一个唯一的数字ID，用rgDispId传回给它
//同理JavaScript存取这个对象的属性时，会把属性名放到rgszNames中，我们需要给这个属性名拟定一个唯一的数字ID，用rgDispId传回给它
//紧接着JavaScript会调用Invoke，并把这个ID作为参数传递进来
HRESULT STDMETHODCALLTYPE CJsCallCppDlg::GetIDsOfNames(REFIID riid, LPOLESTR *rgszNames, UINT cNames, LCID lcid, DISPID *rgDispId)
{
    //rgszNames是个字符串数组，cNames指明这个数组中有几个字符串，如果不是1个字符串，忽略它
    if (cNames != 1)
        return E_NOTIMPL;
    //如果字符串是ShowMessageBox，说明JavaScript在调用我这个对象的ShowMessageBox方法，我就把我拟定的ID通过rgDispId告诉它
    if (wcscmp(rgszNames[0], L"ShowMessageBox") == 0)
    {
        *rgDispId = FUNCTION_ShowMessageBox;
        return S_OK;
    }
    //同理，如果字符串是GetProcessID，说明JavaScript在调用我这个对象的GetProcessID方法
    else if (wcscmp(rgszNames[0], L"GetProcessID") == 0)
    {
        *rgDispId = FUNCTION_GetProcessID;
        return S_OK;
    }
    else
        return E_NOTIMPL;
}
 
//JavaScript通过GetIDsOfNames拿到我的对象的方法的ID后，会调用Invoke，dispIdMember就是刚才我告诉它的我自己拟定的ID
//wFlags指明JavaScript对我的对象干了什么事情！
//如果是DISPATCH_METHOD，说明JavaScript在调用这个对象的方法，比如cpp_object.ShowMessageBox();
//如果是DISPATCH_PROPERTYGET，说明JavaScript在获取这个对象的属性，比如var n = cpp_object.num;
//如果是DISPATCH_PROPERTYPUT，说明JavaScript在修改这个对象的属性，比如cpp_object.num = 10;
//如果是DISPATCH_PROPERTYPUTREF，说明JavaScript在通过引用修改这个对象，具体我也不懂
//示例代码并没有涉及到wFlags和对象属性的使用，需要的请自行研究，用法是一样的
//pDispParams就是JavaScript调用我的对象的方法时传递进来的参数，里面有一个数组保存着所有参数
//pDispParams->cArgs就是数组中有多少个参数
//pDispParams->rgvarg就是保存着参数的数组，请使用[]下标来访问，每个参数都是VARIANT类型，可以保存各种类型的值
//具体是什么类型用VARIANT::vt来判断，不多解释了，VARIANT这东西大家都懂
//pVarResult就是我们给JavaScript的返回值
//其它不用管
HRESULT STDMETHODCALLTYPE CJsCallCppDlg::Invoke(DISPID dispIdMember, REFIID riid, LCID lcid,
    WORD wFlags, DISPPARAMS *pDispParams, VARIANT *pVarResult, EXCEPINFO *pExcepInfo, UINT *puArgErr)
{
    //通过ID我就知道JavaScript想调用哪个方法
    if (dispIdMember == FUNCTION_ShowMessageBox)
    {
        //检查是否只有一个参数
        if (pDispParams->cArgs != 1)
            return E_NOTIMPL;
        //检查这个参数是否是字符串类型
        if (pDispParams->rgvarg[0].vt != VT_BSTR)
            return E_NOTIMPL;
        //放心调用
        ShowMessageBox(pDispParams->rgvarg[0].bstrVal);
        return S_OK;
    }
    else if (dispIdMember == FUNCTION_GetProcessID)
    {
        DWORD id = GetProcessID();
        *pVarResult = CComVariant(id);
        return S_OK;
    }
    else
        return E_NOTIMPL;
}
 
//JavaScript拿到我们传递给它的指针后，由于它不清楚我们的对象是什么东西，会调用QueryInterface来询问我们“你是什么鬼东西？”
//它会通过riid来问我们是什么东西，只有它问到我们是不是IID_IDispatch或我们是不是IID_IUnknown时，我们才能肯定的回答它S_OK
//因为我们的对象继承于IDispatch，而IDispatch又继承于IUnknown，我们只实现了这两个接口，所以只能这样来回答它的询问
HRESULT STDMETHODCALLTYPE CJsCallCppDlg::QueryInterface(REFIID riid, void **ppvObject)
{
    if (riid == IID_IDispatch || riid == IID_IUnknown)
    {
        //对的，我是一个IDispatch，把我自己(this)交给你
        *ppvObject = static_cast<IDispatch*>(this);
        return S_OK;
    }
    else
        return E_NOINTERFACE;
}
 
//我们知道COM对象使用引用计数来管理对象生命周期，我们的CJsCallCppDlg对象的生命周期就是整个程序的生命周期
//我的这个对象不需要你JavaScript来管，我自己会管，所以我不用实现AddRef()和Release()，这里乱写一些。
//你要return 1;return 2;return 3;return 4;return 5;都可以
ULONG STDMETHODCALLTYPE CJsCallCppDlg::AddRef()
{
    return 1;
}
 
//同上，不多说了
//题外话：当然如果你要new出一个c++对象来并扔给JavaScript来管，你就需要实现AddRef()和Release()，在引用计数归零时delete this;
ULONG STDMETHODCALLTYPE CJsCallCppDlg::Release()
{
    return 1;
}

该讲的都在代码注释中讲了，简单来说，当JavaScript执行如cpp_object.GetProcessID();的代码时，会先调用GetIDsOfNames，并把"GetProcessID"这个字符串传递进来，我们给它分配一个自拟的ID，紧接着JavaScript会拿着这个ID来调用Invoke。至于参数和返回值如何传递，代码和注释写得很清楚了。

注意我的HTML中的JavaScript代码中，我用一个 var cpp_object;全局变量来保存C++对象，然后我还写了一个 SaveCppObject()函数给C++调用，在WebBrowser加载完毕HTML文档后，需要先用C++调用JavaScript的这个SaveCppObject()函数，并把C++对象指针传递给JavaScript，这样JavaScript才能把它保存到var cpp_object;中，才能进行接下来的JavaScript调用C++。C++调用JavaScript的SaveCppObject()方法代码如下：

//调用JavaScript的SaveCppObject函数，把我自己(this)交给它，SaveCppObject会把我这个对象保存到全局变量var cpp_object;中
//以后JavaScript就可以通过cpp_object来调用我这个C++对象的方法了
void CJsCallCppDlg::OnBnClickedOk()
{
    CComQIPtr<IHTMLDocument2> document = m_webbrowser.get_Document();
    CComDispatchDriver script;
    document->get_Script(&script);
    CComVariant var(static_cast<IDispatch*>(this));
    script.Invoke1(L"SaveCppObject", &var);
}

好了，至此，JavaScript调用C++已经完成了。这种方法，需要先把IDispatch*(示例代码中是this，但因为this是CJsCallCppDlg的实例，而CJsCallCppDlg多重继承于IDispatch，实际this就是IDispatch*了)传递给JavaScript，JavaScript把它保存好，然后调用它。网上还有一种方法是，在C++这边再实现IDocHostUIHandler接口，然后通过一系列麻烦的操作，JavaScript那边就可以直接通过window.external来调用C++，而不用var cpp_object;了。不过那个实现实在是太麻烦太恶心了，又会引入一大堆我解释不清楚的东西，所以还是作罢了，这样才是最简洁的实现。

最后晒上一张运行效果图：

示例代码的整个VisualStudio项目文件可以到这里下载和查看（版本VS2015）： https://github.com/charlessimonyi/javascript_call_cpp

MSDN上关于IDispatch接口的文档： https://msdn.microsoft.com/en-us/library/windows/desktop/ms221608(v=vs.85).aspx

对了，还有一点，写好的HTML文件不仅可以直接和EXE放在一个目录下使用，也可以在VisualStudio中把HTML文件作为资源添加到项目中，这样最终写出来的程序只有一个EXE，HTML文件已经在EXE里面了，至于如何让WebBrowser加载这个HTML文件，可以在 CxxDlg::OnInitDialog()中使用如下代码：

//加载资源文件中的HTML,IDR_HTML1就是HTML文件在资源文件中的ID
wchar_t self_path[MAX_PATH] = { 0 };
GetModuleFileName(NULL, self_path, MAX_PATH);
CString res_url;
res_url.Format(L"res://%s/%d", self_path, IDR_HTML1);
m_webbrowser.Navigate(res_url, NULL, NULL, NULL, NULL);

常见问题：
①调用m_webbrowser.Navigate()加载一个HTML文档后，不要紧接着就：

CComQIPtr<IHTMLDocument2> document = m_webbrowser.get_Document();
CComDispatchDriver script;
document->get_Script(&script);

这样获取其接口指针进行C++调用Javascript操作，这样往往会取到空指针，因为m_webbrowser.Navigate()调用完毕，并不意味着HTML文档已经加载、渲染完毕，m_webbrowser.Navigate()实际上是一个异步操作，调用以后只是发出了一个命令，让WebBrowser去加载这个HTML文档，至于何时加载完毕，可以处理WebBrowser的 DocumentComplete事件来获知，只有在触发DocumentComplete事件后，才可以获取其接口指针进行操作。所以在上面的示例中，如果想让HTML文档加载完毕后就自动用C++调用Javascript的 SaveCppObject()函数，把C++对象传递过去，只需把上面示例程序中我写在按钮响应函数中的代码写到 DocumentComplete事件的响应函数中即可（Github上的示例代码已经更新成这样了）。
怎么添加DocumentComplete事件响应函数？看下图，先选中WebBrowser控件，再到属性对话框里找想处理的事件，所有的Activex控件的事件响应函数都可以在这里添加。