解析URL(Golang+Python)

35 篇文章 2 订阅

URL格式:

在互联网中,任何一个可访问的文件或文档都具有一个唯一的地址,这种地址称为统一资源定位符(Uniform Resource Locator,简称URL),其格式如下:
	scheme://host[:port][path][:parameters][?query]#fragment
  1. scheme(协议):包括http、https、ftp 以及 file。

  2. hostname(主机名):可以是主机名、域名、服务器IP。例如百度的域名:www.baidu.com

  3. port(端口号):省略端口号时,为各个协议的默认端口号,例如:http的默认端口号为80,mysql的默认端口号是3306,ftp的默认端口号为21。

  4. path(路径):由零或多个“/”符号隔开的字符串,一般用来表示主机上的一个目录或文件地址
    parameters/query(参数):询搜索的部分,需要向服务器传入参数,就在这输入。通过问号?连接到path后面,从“?”开始到“#”为止之间的部分为参数部分,又称搜索部分、查询部分。一般来说,参数都是键值一一对应着,名和值用等号=隔开,参数可以有多个,参数之间用“&”分隔。username=root&password=xxxxxxxxxxxxxx

  5. fragment(单页面路由): 对于HTML 文档来说就是页面内的定位标识符,可以实现 HTML 页面内的定位,如下图所示:

    在这里插入图片描述


Golang解析URL


func AnalyseUrl() {
	webUrl := "https://user:pass@localhost:8000/update?item=socks&price=16#latest"
	u,err:=url.Parse(webUrl)
	if err!=nil{
		fmt.Println("error is:",err.Error())
		return
	}
	
	fmt.Println("scheme:",u.Scheme)
	fmt.Println("username:",u.User.Username())
	password,_ :=u.User.Password()
	fmt.Println("password:",password)
	fmt.Println("host:",u.Hostname())
	fmt.Println("port:",u.Port())
	fmt.Println("path:",u.Path)
	fmt.Println("query:",u.Query())
	fmt.Println("fragment:",u.Fragment)

	item:=u.Query().Get("item") // 获取item
	fmt.Println("item:",item)
}

Python解析URL


from urllib.parse import urlparse,parse_qs

web_url = "https://user:pass@localhost:8000/update?item=socks&price=16#latest"

result = urlparse(web_url)
print('scheme:',result.scheme)
print('host:',result.username)
print('port:',result.password)
print('host:',result.hostname)
print('port:',result.port)
print('path:',result.path)
print('query:',result.query)
print('params:',result.params)
print('fragment:',result.fragment)

item = parse_qs(result.query).get('item') #  获取item,得到的是一个列表,也可以用parse_qsl
print('item:',item)

这个params还不清楚到底是什么东西,难道是静态网页才有?有知道的小伙伴麻烦留言相告,万分感谢!!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值