在webview中获取网页源码

1. 使能javascript: 

?
1
webView.getSettings().setJavaScriptEnabled( true );

2. 编写本地接口

?
1
2
3
4
5
final class InJavaScriptLocalObj {
     public void showSource(String html) {
         Log.d( "HTML" , html);
     }
}


3. 向网页暴露本地接口

?
1
webView.addJavascriptInterface( new InJavaScriptLocalObj(), "local_obj" );


4. 编写自己的WebViewClient,并在onPageFinished中提取网页源码。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
final class MyWebViewClient extends WebViewClient{ 
     public boolean shouldOverrideUrlLoading(WebView view, String url) {  
         view.loadUrl(url);  
         return true ;  
    
     public void onPageStarted(WebView view, String url, Bitmap favicon) {
         Log.d( "WebView" , "onPageStarted" );
         super .onPageStarted(view, url, favicon);
     }   
     public void onPageFinished(WebView view, String url) {
         Log.d( "WebView" , "onPageFinished " );
         view.loadUrl( "javascript:window.local_obj.showSource('<head>'+" +
                 "document.getElementsByTagName('html')[0].innerHTML+'</head>');" );
         super .onPageFinished(view, url);
     }
}

 

组合在一起的代码为:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
package com.hi.briancol.htmlsource;
 
import android.app.Activity;
import android.graphics.Bitmap;
import android.os.Bundle;
import android.util.Log;
import android.webkit.WebView;
import android.webkit.WebViewClient;
 
public class HtmlSource extends Activity {
     private WebView webView;
     /** Called when the activity is first created. */
     @Override
     public void onCreate(Bundle savedInstanceState) {
         super .onCreate(savedInstanceState);
         setContentView(R.layout.main);
         webView = (WebView)findViewById(R.id.webview);
         webView.getSettings().setJavaScriptEnabled( true );
         webView.addJavascriptInterface( new InJavaScriptLocalObj(), "local_obj" );
         webView.setWebViewClient( new MyWebViewClient());
         webView.loadUrl( "http://www.cnblogs.com/hibraincol/" );
     }
     
     
    final class MyWebViewClient extends WebViewClient{ 
         public boolean shouldOverrideUrlLoading(WebView view, String url) {  
             view.loadUrl(url);  
             return true ;  
        
         public void onPageStarted(WebView view, String url, Bitmap favicon) {
             Log.d( "WebView" , "onPageStarted" );
             super .onPageStarted(view, url, favicon);
         }   
         public void onPageFinished(WebView view, String url) {
             Log.d( "WebView" , "onPageFinished " );
             view.loadUrl( "javascript:window.local_obj.showSource('<head>'+" +
                     "document.getElementsByTagName('html')[0].innerHTML+'</head>');" );
             super .onPageFinished(view, url);
         }
     }
     
     final class InJavaScriptLocalObj {
         public void showSource(String html) {
             Log.d( "HTML" , html);
         }
     }
}

关键之处在于:

view.loadUrl("javascript:window.local_obj.showSource('<head>'+document.getElementsByTagName('html')[0].innerHTML+'</head>');");

运行,可以看到在showSource(String html)中打印了网页


转自:http://www.360doc.com/content/12/0101/21/26
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Selenium本身并不支持直接操作Webview2,但可以通过一些第三方库来实现。以下是使用winrt库来获取Webview2网页部分的示例代码: ```python import winrt.windows.ui.core as core import winrt.windows.ui.input as input import winrt.windows.system as system from selenium import webdriver # 启动Webview2 edge_options = webdriver.EdgeOptions() edge_options.use_chromium = True edge_options.add_argument("disable-gpu") driver = webdriver.Edge(options=edge_options) driver.get("https://www.example.com/") # 获取Webview2控件的句柄 window_handle = driver.current_window_handle app_view = system.DisplayingApplication.get_current().get_app_view_for_current_thread() webview_handle = app_view.get_hosted_view_for_current_thread().core_window.handle core_window = core.CoreWindow.get_for_current_thread() # 模拟键盘按键,使Webview2控件获得焦点 input.Keyboard.get_for_current_view().try_set_input_scope(input.InputScopeNameValue.url) input.Keyboard.get_for_current_view().try_move_focus(input.FocusNavigationDirection.next) # 截取Webview2网页部分的屏幕截图 webview_rect = core_window.bounds webview_bitmap = core.Screenshot.capture(webview_handle, webview_rect) webview_bitmap.save_to_file("webview_screenshot.png") ``` 上述代码,通过winrt库获取Webview2控件的句柄,然后模拟键盘按键,使Webview2控件获得焦点。最后通过CoreWindow的Screenshot方法截取了Webview2网页部分的屏幕截图。 ### 回答2: 在Selenium获取Webview2网页部分,需要通过以下步骤: 1. 首先,确保已经安装了适当版本的Webview2运行时和驱动程序。 2. 创建一个WebDriver实例,用于控制Webview2浏览器。可以使用selenium的`webdriver.WebView`方法来实现。 3. 使用`get()`方法访问目标网址,例如:`driver.get("https://example.com")`。 4. 要获取Webview2网页部分,可以使用以下方法: - 使用`driver.find_element_by_xpath()`或`driver.find_elements_by_xpath()`方法定位到想要获取网页元素。 - 使用`driver.execute_script(js_script)`方法执行JavaScript脚本,js_script可以是获取网页元素的JavaScript代码。 - 使用`driver.page_source`属性获取整个网页源代码,然后使用字符串处理方法,如正则表达式或解析器(如BeautifulSoup)来提取所需部分。 5. 如果需要等待特定的网页元素加载完成,可以使用`WebDriverWait`类和`expected_conditions`模块来实现。例如,使用`expected_conditions.presence_of_element_located`等待元素出现。 6. 最后,记得在使用完毕后关闭WebDriver实例,释放资源。可以使用`driver.quit()`方法来关闭浏览器。 需要注意的是,Webview2暂时不支持所有的Selenium功能,可能会有一些限制。在使用Webview2时,建议参考官方文档和相关社区资源来了解更多的用法和解决可能遇到的问题。 ### 回答3: Selenium 是一种用于自动化浏览器操作的工具,它通常用于测试网页应用程序。Selenium 支持许多不同类型的浏览器和窗口,包括普通的网页窗口和 WebView2。 WebView2 是一种用于 Windows 平台的 WebView 技术,它允许嵌入和集成 web 内容到应用程序。要在 WebView2 获取网页的部分内容,可以使用以下步骤: 1. 安装并设置 WebView2 运行环境:首先,你需要在你的计算机上安装 WebView2 运行时。你可以从 Microsoft 的官方网站上下载并安装 WebView2 运行时。安装完成后,设置你的项目依赖库和引用,以便与 WebView2 运行时进行关联。 2. 初始化和加载 WebView2 控件:在你的代码创建一个 WebView2 控件实例,并将其加载到你的应用程序界面。你可以设置 WebView2 控件的位置和大小,以适应你的需求。 3. 获取网页的部分内容:一旦 WebView2 控件加载了网页,你就可以使用 Selenium 的 API 操作 WebView2 网页。利用 Selenium 的元素定位和操作方法,你可以通过在 WebView2 查找和操作网页元素,从而获取网页的部分内容。 例如,你可以使用 Selenium 的 `find_element_ 方法定位指定的 HTML 元素,并使用 `get_attribute` 方法获取该元素的指定属性值。你还可以使用 `text` 方法获取该元素的文本内容。 需要注意的是,由于 WebView2 是用于 Windows 平台的技术,你需要确保 Webview2 控件已正确安装和配置,并正确设置与之关联的项目依赖库和引用。 以上是关于如何使用 Selenium 获取 WebView2 网页部分内容的简要说明。具体的实现方式可能根据你的具体应用场景而有所不同,你可以在 Selenium 和 WebView2 的官方文档找到更详细的信息和示例代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值