获取一个网址https://www.baidu.com/......中的www.baidu.com

最新推荐文章于 2024-08-18 20:36:52 发布

LK_qiqiqi

最新推荐文章于 2024-08-18 20:36:52 发布

阅读量10w+

点赞数 7

分类专栏： url解析文章标签： python中url解析

本文链接：https://blog.csdn.net/lk_qiqiqi/article/details/79737929

版权

url解析专栏收录该内容

1 篇文章 1 订阅

订阅专栏

可以使用python中的内置模块urllib.parse中的urlparse

以下为urlparse说明

Help on function urlparse in module urllib.parse:

urlparse(url, scheme='', allow_fragments=True)
Parse a URL into 6 components:
<scheme>://<netloc>/<path>;<params>?<query>#<fragment>
Return a 6-tuple: (scheme, netloc, path, params, query, fragment).
Note that we don't break the components up in smaller bits

(e.g. netloc is a single string) and we don't expand % escapes.

urlparse将其解析为6个部分

获取www.baidu.com只需要将<scheme>://<netloc>/<path>;<params>?<query>#<fragment>

中netloc部分取出即可

netloc只会取到://到第一个/之间的字符串

代码演示：

import urllib.parse

url = 'https://www.baidu.com/?tn=98012088_5_dg&ch=12'
sp = urllib.parse.urlparse(url)

print(sp.netloc)

www.baidu.com

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LK_qiqiqi

关注关注

7
点赞
踩
7

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

访问www.baidu.com全过程

PHPArchitect的博客

06-17

1万+

1.域名解析成IP 每个主机在网络中都是IP为标识的，IP才是主机在网络中的位置，域名只是为了方便用户记忆而已，这就要求浏览器能够识别域名并且将其转化为对应的IP地址。所以浏览器会有一个DNS缓存，其中记录了一些域名与IP的对应关系，供浏览器快速查找需要的IP。但是这个DNS缓存不可能存下所有的域名-IP地址，何况IP地址有时候还会变化，因此当在浏览器DNS缓存中没有找到的时候，就要先向DN...

JAVA商业项目源代码--商铺经营管理系统（解压密码https://www.baidu.com/）

05-24

JAVA商业项目源代码--商铺经营管理系统

4 条评论您还未登录，请先登录后发表或查看评论

什么是HTTPS加密协议？HTTPS安全传输原理，SSL和TLS介绍，NGINX如何配置SSL证书

热门推荐

小沐

05-08

5万+

http://www.baidu.com http://www.sougou.com http://www.google.com http://www.tencent.com

chrome浏览器打开百度http出现红叉 https://www.baidu.com

weixin_30435261的博客

11-22

5828

因为百度使用了SHA-1的算法，并没有使用SHA-2。现在打开百度就是一直刷新一直跳，根本出不来。解决：删除对某个域名的强制转跳即可方法：chrome的地址栏输入：chrome://net-internals/#hsts ，在Delete domain 栏的输入框中输入要http访问的域名，然后点击“delete”按钮，即可完成配置。然后你可以在 Query domain 栏中搜索刚才输...

chrome浏览器打开百度http出现红叉

空名先生

08-28

1万+

因为百度使用了SHA-1的算法，并没有使用SHA-2。现在打开百度就是一直刷新一直跳，根本出不来。解决：用IE打开百度首页前端协议显示是http，所以我想打不开百度网页是因为chrome强制转跳https，所以删除对某个域名的强制转跳即可，方法：chrome的地址栏输入：chrome://net-internals/#hsts ，在Delete domain 栏的输入框中输入

15.浏览器输入一个网址（www.baidu.com）后执行的全过程

郑学炜的技术博客

04-22

2万+

1、客户端浏览器通过DNS解析到www.baidu.com的IP地址202.108.22.5，通过这个IP地址找到客户端到服务器的路径。客户端浏览器发起一个HTTP会话到202.108.22.5，然后通过TCP进行封装数据包，输入到网络层。 2、在客户端的传输层，把HTTP会话请求分成报文段，添加源和目的端口，如服务器使用80端口监听客户端的请求，客户端由系统随机选择一个端口如5000，与服务器进...

tracert www.baidu.com

weixin_30670965的博客

05-28

603

转载于:https://www.cnblogs.com/xilifeng/archive/2012/05/28/2521520.html

解析http://www.baidu.com/link?url=

Meditation_Crazy

03-26

2万+

前言在网上搜索，有说url后面的参数是百度收录后生成的参数。解析方式：https://blog.csdn.net/weixin_30883777/article/details/94793401 模拟请求，得到真正的地址 php方式 https://www.cnblogs.com/xcsn/p/4678304.html <?php $url = "http://www.baidu...

Jmeter压测-对https：www。baidu。com进行压测

weixin_42770598的博客

09-01

2018

压测链接： https://www.baidu.com/sugrec?type=3&prod=his&pic=1&from=wise_web&lid=3966523364-1&ishome=1&net=1&islogin=0&hissid=110085,127969,131861,164870,175755,176678,177370,177941,178327,178384,178529,178603,179345,179358,179449

http://www.baidu.com/s?kw=&sc=web&cl=3&tn=sitehao123&ct=0&rn=&lm=&ie=gb2312&rs2=&myselectvalue=&f=&pv=&z=&from=&word=%c1%d4%c9%b1%d5%df%cd%e2%b9%d2&tn=shnetzone_pg

08-08

http://www.baidu.com/s?kw=&sc=web&cl=3&tn=sitehao123&ct=0&rn=&lm=&ie=gb2312&rs2=&myselectvalue=&f=&pv=&z=&from=&word=%c1%d4%c9%b1%d5%df%cd%e2%b9%d2&tn=shnetzone_pg

获取网页链接

zkwniky的博客

05-09

629

public void fetchLink() { String url = "http://www.hainan.net"; try { Document doc = Jsoup.connect(url).get(); Elements links = doc.select("a[href]"); for (Element link : links) { String

报错处理——https://www.baidu.com/search/error.html

jinxlzc的博客

04-15

1万+

OMG，今天在实验室自习，突然发现浏览器打不开百度主页了，输入百度域名www.baidu.com连接了半天最后跳到了这一路径：https://www.baidu.com/search/error.html，页面如下：但我发现，QQ可以正常使用，CSDN，GitHub，腾讯，牛客网的首页都可正常访问，但是百度始终访问不了，我起初怀疑是平时乱搞代理，DNS服务器出现了问题，极不情愿的启动了36...

简单的获取网站地址

weixin_30478619的博客

05-09

376

private string GetAbsoluteUri() { int index = Request.Url.AbsoluteUri.LastIndexOf('/'); string path = Request.Url.AbsoluteUri.Substring(0, index + 1); return path; } 转载于:ht...

百度搜索框提示 https://www.baidu.com/js/opensug.js

gwdgwd123的博客

01-02

8635

从浏览器打开http://www.baidu.com地址回车发送请求到看到页面的过程？

Michaeles的博客

01-12

2万+

一、整体过程 1.将域名解析成ip的过程； 2.通过ip找到网站服务器，请求打开具体的网页，服务器响应请求，客户端浏览器收到响应报文后，渲染html文档，最终看到网页页面。二、原理 1.dns解析的流程？（1）输入网址回车的时候，浏览器首先查询浏览器的缓存，如果没找到就去查询本地的dns缓存和hosts文件，如果有www.baidu.com这个域名对应的ip，则直接通过这个ip访...

访问网站过程，以www.baidu.com.为例

weixin_42480196的博客

09-09

2359

本文图片来源于https://blog.csdn.net/xy010902100449/article/details/48274635 用户在浏览器输入www.baidu.com，浏览器首先查找浏览器缓存，如果存在百度的缓存直接返回结果，如果不存在查找主机中的hosts文件，如果存在百度的信息，主机直接进行访问，如果不存在查找本机首选的DNS缓存服务器中是否存在有百度缓存，如果存在，返回给...

https://www.baidu.com/?from=2001l这个链接我需要截取www.baidu.com出来再加个/，能搞吗。当然能

weixin_64974855的博客

05-09

2911

https://www.baidu.com/?from=2001l这个链接我需要截取www.baidu.com出来再加个/。uRL地址处理

https://www.baidu.com/s参数

01-16

你可以使用Python的requests库来获取网页的内容。下面是一个示例代码： ```python import requests url = "https://www.baidu.com/s" params = { "wd": "参数" } response = requests.get(url, params=params) content = response.text print(content) ``` 这段代码中，我们使用了requests库发送了一个GET请求，指定了url为"https://www.baidu.com/s"，并且传递了一个名为"wd"的参数，值为"参数"。然后，我们通过response.text获取到了网页的内容，并将其打印出来。