Python获取URL中的域名

weixin_41934979

已于 2024-06-23 22:38:44 修改

阅读量318

点赞数 5

文章标签： python 服务器

于 2024-06-23 22:36:25 首次发布

本文链接：https://blog.csdn.net/weixin_41934979/article/details/139867468

版权

方法一：

推荐使用

from urllib.parse import urlsplit

url = "https://www.baidu.com"
host=urlsplit(url).hostname
print(host)  # www.baidu.com

方法二：

import urllib

url = "https://www.baidu.com"
host = urllib.parse.urlparse(url).netloc
print(host)  # www.baidu.com

方法一和方法二都是使用Python内置库urllib

方法三：

import tldextract

url = "https://www.baidu.com"
domain = tldextract.extract(url).registered_domain
print(domain)  # baidu.com

方法三使用第三方类库(tldextract)可以自动识别出url中的顶级域名（TLD），包括域名和子域名在内的所有部分

方法四：

import re

url = "https://www.baidu.com"
domain = re.search("[a-zA-Z0-9]+\.[a-zA-Z0-9]+", url).group()
print(domain)  # www.baidu

方法四使用正则表达式，个人不推荐使用，因为自己编写的表达式有待检验，容易出问题

参考资料

https://pythonjishu.com/wftsjmvhbpeekpj/

https://blog.csdn.net/zhyl8157121/article/details/109334091

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_41934979

关注关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Python获取URL中的域名

python获取url域名
复制链接

扫一扫

python3 提取url中域名部分_Python实现从url中提取域名的几种方法

weixin_28818721的博客

12-29

805

import refrom urlparse import urlparsetopHostPostfix = ('.com','.la','.io','.co','.info','.net','.org','.me','.mobi','.us','.biz','.xxx','.ca','.co.jp','.com.cn','.net.cn','.org.cn','.mx','.tv','.ws',...

python 正则获取域名,Python实现从url中提取域名的几种方法

weixin_35943182的博客

03-25

1674

从url中找到域名,首先想到的是用正则，然后寻找相应的类库。用正则解析有很多不完备的地方，url中有域名，域名后缀一直在不断增加等。通过google查到几种方法，一种是用Python中自带的模块和正则相结合来解析域名，另一种是使第三方用写好的解析模块直接解析出域名。要解析的url代码如下:urls = [“http://meiwen.me/src/index.html”,“http://1000c...

参与评论您还未登录，请先登录后发表或查看评论

python解析URL中的域名

匹夫的博客

09-22

2227

import urllib.parse import socket url = ‘你要获取的网址’ ym = urllib.parse.urlparse(url).hostname print(ym) ip = socket.gethostbyname(ym) print(ip) hn = socket.gethostbyaddr(ip) print(hn[0])

python - 从url中提取域名和path

Orange_hhh的博客

11-26

1971

一般来说从字符串中提取想要的部分都是正则表达式或者第三方库，python 的库都是非常强大，持续学习，持续进步。

python 获取 url 域名

清泉影月

01-19

2566

前言：获取 url 域名方法不外乎三种： 1.切割 url 字符串，把域名单独拿出来 2.正则匹配 3.借用别人写好的包个人推荐第三种哈，要不然冷落了别人不好，毕竟大家都是同行举例 py2.7环境，py3 可能用法有变 import urlparse host = urlparse.urlparse('https://blog.csdn.net/qingquanyingyue') prin...

Python3 url域名获取

qq_43654142的博客

08-06

864

Python3 url域名获取通过内置模块urllib进行获取： from urllib.parse import urlparse url = "http://zhidao.baidu.com" print(urlparse(url)) 输出信息：ParseResult(scheme=‘http’, netloc=‘zhidao.baidu.com’, path=’’, params=...

Python 如何获取 url 中的域名

热门推荐

Bottle's Blog

10-28

5万+

分析如题，咋整。先简单分析一下，这个问题的解决方法大致分两种。第一种，自己手撸。第二种，选择成熟的轮子，毕竟我们高贵的双手还要用来搬砖，没有时间用来造重复的轮子。开搞一、手写咱们先说说手撸，没啥特殊的，就是字符串截取，稍微高级一点可以把正则用上。比如下面就是一个小例子： def get_domain_by_re(u): d = re.search(r"(?<=http[s]://)[.\w-]*(:\d{,8})?((?=/)|(?!/))", u).group() r

使用python提取url中的顶级域名及其后缀

IT之一小佬的博客

05-05

3007

提取url中的信息，可以使用python中的urlparse模块进行解析，但是有个缺陷是无法提取顶级域名。参考博文：https://blog.csdn.net/weixin_44799217/article/details/124591187 提取较为复杂的url信息，还可以使用tld模块。安装方法：：通过tld模块可以提取一个url中的顶级域名（不包含后缀部分）、顶级域名（包含后缀部分）、域名后缀和子域名部分（不含后缀）。注意：使用tld模块时，域名中...

python获取url顶级域名

09-11

python获取url顶级域名：支持 http://baidu.com www.baidu.com http://www.baidu.com 后缀支持： ".com", ".cn", ".com.cn", ".gov", ".net", ".edu.cn", ".net.cn", ".org.cn", ".co.jp", ".gov.cn", ".co.uk", ...

python之了解url网址相关内容

03-21

在Python中，处理URL的相关库，如`urllib.parse`，可以帮助我们解析、构建和操作URL。 1. **URL的结构** - **协议**：URL的开头部分定义了数据传输的协议，最常见的是HTTP（超文本传输协议）和HTTPS（安全版的HTTP...

python爬虫之遍历单个域名

09-18

在本篇内容中，我们将讨论如何使用Python来遍历一个域名下的所有相关页面，并特别关注维基百科的示例。首先，遍历一个域名通常涉及到以下几个步骤： 1. **发起请求**：使用`urllib.request.urlopen()`或`requests...

python使用urlparse分析网址中域名的方法

12-25

本文实例讲述了python使用urlparse分析网址中域名的方法。分享给大家供大家参考。具体如下：这里给定网址，通过下面这段python代码可以很容易获取域名信息 import urlparse url = "//www.jb51.net" domain = ...

python程序：顶级域名获取所有host，获取网页信息 keyword,title,describle等信息

08-14

本项目主要关注如何使用Python来获取顶级域名下的所有Host，并提取网页的关键信息，如Keyword、Title和Description。这里我们将详细讲解相关的Python知识、HTTP协议以及网络爬虫的基本原理。首先，Python是编写...

Ansys Zemax｜场曲跟畸变图的前世今生

ueotek的博客

07-02

388

这里的y和z坐标和方向余弦是（Hx, Hy, Px, Py）=（X, X, 0 ,0）和（Hx, Hy, Px, Py）=（X, X, 0 ,0.001），在光线追迹像面的前一个平面的 z坐标和方向余弦。OpticStudio通过在X和Y方向（弧矢和子午方向）的傍轴光线追踪确定近轴图像平面的Z坐标，并测量该近轴焦平面与系统图像平面的Z坐标之间的距离。使用附件中的样本文件，近轴像面的全局Z坐标与视场0处的像面位置之差与场曲和畸变图中的的Tan Shift相同。近轴像面的定义是以下两个光线交点的全局Z坐标。

10.javaSE基础_JDBC编译程序(Driver+Statement+Connection+mysql数据库连接)

m0_61086522的博客

07-02

1240

JDBC是的缩写。它是Sun的Javasoft公司制定的Java数据库连接技术，是一套标准接口java.sql包中提供了JDBC API,通过它连接到各种数据库系统，编写访问数据库的程序。JDBC API不能直接访问数据库，它依赖于数据库厂商提供的JDBC Driver（JDBC驱动程序）

Java基础:爬虫

最新发布

weixin_65752158的博客

07-04

834

Pattern:表示正则表达式Matcher:文本匹配器，作用按照正则表达式的规则去读取字符串，从头开始读取。在大串中去找符合匹配规则的子串。通过Pattern p = Pattern.compile("正则表达式");获得通过Matcher m = p.matcher(str);获得 (m要在str中找符合p规则的小串)其中, m为Matcher对象, p为正则表达式规则, str为要验证的字符串. boolean b = m.find(); 表示拿着文本匹配器从头开始读取，寻找是否有

使用Python实现深度学习模型：序列建模与生成模型的博客教程

Echo_Wish的博客

07-02

1078

本文介绍了使用Python实现深度学习模型的序列建模和生成模型的步骤。我们详细说明了每个步骤，并提供了相应的代码示例。通过学习本文，您将能够使用Python构建和训练序列建模和生成模型，并生成新的序列数据。希望本文对您有所帮助！如果您有任何问题或建议，请随时提出。

Java高级重点知识点-19-Lambda

m0_72926194的博客

07-02

494

本文主要是讲解了如何使用lambda表达式来简介代码开发，同时讲解了函数式编程思想，该思想主要的是体现做什么，而不是怎么做。

获取url中的协议+域名

06-01

您可以使用Python中的urllib库来获取URL的协议和域名部分。以下是一个示例代码： ```python from urllib.parse import urlparse url = "https://www.example.com/path?query=string" protocol_domain = urlparse(url).scheme + "://" + urlparse(url).netloc print(protocol_domain) # 输出"https://www.example.com" ``` 这个代码使用了Python中的`urlparse`函数来解析URL，然后使用`scheme`属性获取协议部分，使用`netloc`属性获取域名部分，最后将它们拼接起来。注意，这个方法也会包括子域名和端口号，如果您只需要主域名和协议，可以再进行一些处理。

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交