google搜索---搜索指定网页的内容

<input type="text" value="google搜索" name="google" /><input type="button" value="Google" name="google"/><br /> <script type="text/javascript"> $("input[type='button']").click(function(){ var value=$("input:text[name="+this.name+"]").val(); var link=""; //w3school var w3=" site:www.w3school.com.cn"; if(this.name=="baidu"){link="http://www.baidu.com/s?wd="} else if(this.name=="google"){link="http://www.google.com.hk/search?hl=zh-CN&source=hp&q="} open(link+value+w3); }); </script>
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我了解了。您的问题是如何使用Selenium搜索并爬取网页上的特定信息。以下是步骤: 1. 安装Selenium库。您可以使用以下命令在Python安装它: ``` pip install selenium ``` 2. 下载并安装浏览器驱动。Selenium需要浏览器驱动来模拟用户在网页上的操作。您可以选择使用Chrome、Firefox、Edge等浏览器的驱动。下载地址如下: - Chrome驱动:https://sites.google.com/a/chromium.org/chromedriver/downloads - Firefox驱动:https://github.com/mozilla/geckodriver/releases - Edge驱动:https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/ 下载后,将驱动程序的路径复制到您的Python代码。 3. 编写Python代码。以下是一个简单的示例,它使用Selenium和Chrome驱动来搜索并爬取CSDN博客指定信息: ```python from selenium import webdriver from selenium.webdriver.common.keys import Keys # 使用Chrome浏览器驱动 driver = webdriver.Chrome('/path/to/chromedriver') # 打开CSDN博客首页 driver.get('https://www.csdn.net/') # 在搜索输入关键字 search_box = driver.find_element_by_name('q') search_box.send_keys('Python') search_box.send_keys(Keys.RETURN) # 找到搜索结果的第一篇博客,并点击进入 result = driver.find_element_by_css_selector('.search-list .title') result.click() # 爬取博客指定信息 content = driver.find_element_by_css_selector('.blog-content-box') print(content.text) # 关闭浏览器 driver.quit() ``` 这个示例会在Chrome浏览器打开CSDN博客首页,然后在搜索输入关键字“Python”,并在搜索结果找到第一篇博客。接着,它会爬取这篇博客内容,并输出到控制台。最后,关闭浏览器。 您可以根据需要修改代码搜索关键字、选择器等参数,以适应不同的网页和信息爬取需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值