使用CInternetSession和CHttpFile提取网页源码

程序界面:

为编辑框添加一个对应的变量:m_sUrl,再为Button1添加点击事件,主要代码如下:

void CGetHtmlCodeDlg::OnButton1()
{
    CString sHtml;
 
    UpdateData();
    GetHtmlCode(m_sUrl, sHtml);
    WritetoFile(sHtml);
    MessageBox("提取网页源码完成");
}
 
void CGetHtmlCodeDlg::GetHtmlCode(const CString url, CString &html)
{
    CInternetSession session;
    CHttpFile * file = NULL;
     
    try
    {
        file = (CHttpFile *)session.OpenURL(url);
        if(file)
        {
            CString line;
            while(file->ReadString(line) != NULL)
            {
                html += line + "\n";
            }
            file->Close();
        }
    }
    catch (CInternetException* e)
    {
        e->Delete();
        html = "CInternet Exception";
    }
    file = NULL;
    session.Close();
}
 
BOOL CGetHtmlCodeDlg::WritetoFile(const CString& sValue)
{
    CString sFile = GetExePath() + "\\1.html";
     
    CStdioFile file;
    if(file.Open(sFile, CFile::modeCreate | CFile::modeWrite | CFile::modeNoTruncate))
    {
        file.SeekToEnd();              // 移动文件指针到末尾
        file.WriteString(sValue);
        file.Close();
    }
    return FALSE;
}
 
CString CGetHtmlCodeDlg::GetExePath()
{
    char sFileName[256] = {0};
    CString sPath = _T("");
     
    GetModuleFileName(AfxGetInstanceHandle(), sFileName, 255);
    sPath.Format("%s", sFileName);
    int pos = sPath.ReverseFind('\\');
    if(pos != -1)
        sPath = sPath.Left(pos);
    else
        sPath = _T("");
     
    return sPath;
}



来源:http://www.cnblogs.com/joeblackzqq/archive/2011/01/07/1929488.html
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值