双斜杠python_Python中的URL解析-规范化路径中的双斜杠

最新推荐文章于 2024-07-30 10:50:42 发布

weixin_39580041

最新推荐文章于 2024-07-30 10:50:42 发布

阅读量343

点赞数

文章标签：双斜杠python

路径（//path）本身无效，这会混淆函数并被解释为主机名If a URI does not contain an authority component, then the path cannot begin with two slash characters ("//").

我不太喜欢这两种解决方案，但它们都有效：import re

import urlparse

testurl = 'http://www.example.com//path?foo=bar'

parsed = list(urlparse.urlparse(testurl))

parsed[2] = re.sub("/{2,}", "/", parsed[2]) # replace two or more / with one

cleaned = urlparse.urlunparse(parsed)

print cleaned

# http://www.example.com/path?foo=bar

print urlparse.urljoin(

testurl,

urlparse.urlparse(cleaned).path)

# http://www.example.com//path

根据所做的操作，您可以手动进行连接：import re

import urlparse

testurl = 'http://www.example.com//path?foo=bar'

parsed = list(urlparse.urlparse(testurl))

newurl = ["" for i in range(6)] # could urlparse another address instead

# Copy first 3 values from

# ['http', 'www.example.com', '//path', '', 'foo=bar', '']

for i in range(3):

newurl[i] = parsed[i]

# Rest are blank

for i in range(4, 6):

newurl[i] = ''

print urlparse.urlunparse(newurl)

# http://www.example.com//path

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39580041

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python3.11.5的入门与实战

一土~的博客

09-17

1608

文章包含python入门与实战内容，将持续更新最新版3.11.5的案例和代码基础，欢迎收藏+关注哦

Python基础第一周--Python语言家族

最新发布

专注探索c++，Linux等后台开发相关机制，欢迎关注，欢迎交流

07-30

162

解决方法：鼠标移动到工作区打开的文件上，把打开的窗口都关闭掉，然后再试试。

python路径必须用双斜线分隔

就在昨天之技术点滴

04-01

5950

对于使用python的交互窗口，可以添加路径来把需要导入文件的路径添加到python可识别路径中。即使用如下代码： import sys sys.path.append('需要添加的路径') 接着可以导入“需要添加的路径"中的python模块。对于需要添加的路径，在windows系统中，分隔符同意用双反斜线\\表示，如：C:\\Users\\Administrator\\sourc...

python接口定义规范化_URL规范化Python实现

weixin_39908616的博客

12-16

226

指向同一资源的URL表现形式可能存在差异，例如，下面三个URL实际上指向的是同一资源：http://www.REDICECN.com/http://www.redicecn.comhttp://www.redicecn.com/tools/../对于爬虫来说，合理的处理方式是将上述三个表现不同URL视为相同的URL。下面给出一个Python的解决方案，没有考虑URL编码的问题：# url_norm...

python标准化地址_Python中的URL解析-标准化路径中的双斜杠

weixin_42119989的博客

01-13

262

I am working on an app which needs to parse URLs (mostly HTTP URLs) in HTML pages - I have no control over the input and some of it is, as expected, a bit messy.One problem I'm encountering frequently...

python爬虫爬取到的网址和文档带有多余的反斜杠的处理

Roxannekkk的博客

11-13

2591

在利用python爬取数据时，遇到了以下两个问题，爬取到的url以及文档带有多余的转义字符反斜杠具体情况如下：网址：'http:\\/\\/slide.fashion.sina.com.cn\\/s\\/slide_24_84625_138650.html', 'https:\\/\\/fashion.sina.com.cn\\/s\\/fo\\/2020-11-13\\/1051\\/doc-iiznctke1091604.shtml' 文档内容： '\\u674e\\u5b87\\u6625\\u7

URL如何标准化？

从零开始学习python --zeropython

06-02

339

URL如何标准化？对于首页我们一般选择带www的作为唯一的URL，对于一级目录时，一般直接用目录形式，而不带index.php等等，这里，我要给你强调一个思路。请记住：每个关键词对应的应该是一个URL而不是多个。(但可以多个关键词对应同一个URL) 有点难理解?是的，刚开始几乎所有人都不明白，但当你把这个搞明白了，你就又前...

Google开源项目Python 语言规范

baidu_35183648的博客

11-12

1398

Python语言代码规范 1.Python 语言规范 1.1. Lint Tip: 使用该 pylintrc 对你的代码运行 pylint 定义: pylint 是一个在 Python 源代码中查找 bug 的工具. 对于 C 和 C++ 这样的不那么动态的语言, 这些 bug 通常由编译器来捕获. 由于 Python 的动态特性, 有些警告可能不对，不过伪告警应该很少。优点: 可以捕获容易忽视的错误, 例如输入错误, 使用未赋值的变量等。缺点: pylint 不完美. 要利用其优势, 我们有时侯需要:

python基础语法--python语言及其应用

博客

10-09

3818

python基础语法 python python语言是一种高级动态、完全面向对象的语言。 python中函数、模块、数字、字符串都是对象。 python完全支持继承、重载、派生、多继承。 python程序运行方式1：交互式运行python语句运行方式2：保存源文件运行程序交互式运行python’语句打开IDLE–科学计算器 ![在这里插入图片描述](https://img-blog.csdnimg.cn/2020092819524773.png#pic_r 第一行程序代码编写 ID

Python面试题整理-牛客网

mysteryflower的专栏

01-20

3594

1、[单选题]关于Python内存管理，下列说法错误的是 A. 变量不必事先声明 B. 变量无须先创建和赋值而直接使用 C. 变量无须指定类型 D. 可以使用del释放资源解析1：B Python 是弱类型脚本语言，变量就是变量，没有特定类型，因此不需要声明。但每个变量在使用前都必须赋值，变量赋值以后该变量才会被创建。用 del 语句可以释放已创建的变量（已占用的资源）。解析2： 1.变量无需事先声明 2.变量无需指定类型 3.程序员不用关心内存管理 4.变量名会被“回收” 5.del语句能够直.

python 文件路径斜杠变成两道_如何摆脱python windows文件路径字符串中的双反斜杠？...

weixin_39792803的博客

11-28

688

I have a dictionary:my_dictionary = {"058498":"table", "064165":"pen", "055123":"pencil"}I iterate over it:for item in my_dictionary:PDF = r'C:\Users\user\Desktop\File_%s.pdf' %itemdoIt(PDF)def doIt(P...

python提取路径名称，最后一个正斜杠后边图片名称（加后缀）字符串（python小白学习笔记五）

渴望飞的鱼的博客

11-05

1万+

爬取京东图片的时候，遇到了一个问题，假如需要把图片存储进去数据库，需要把图片路径和图片名称存储进去数据库，但是图片路径是正斜杠，如下：/img11.360buyimg.com/n7/jfs/t25855/259/1224767986/141142/af393ca6/5b8e328dN0671ae1e.jpg。那么如何提取到 af393ca6/5b8e328dN0671ae1e.jpg 这个名称...

python文件路径拼接多出斜杠_使用斜杠将多个字符串连接到python中的路径

weixin_35789885的博客

02-04

1535

这里的解决方案取决于上下文：您希望为用户提供多少功率？你有多信任他们输入合理的东西？结果是您想获得相对路径还是绝对路径？>选项1：为用户供电让用户做他们想做的任何事情,并让他们自己负责：result = os.path.join(mr, cn, lp, vin)# result: '/data/dir/var'这为用户提供了最大程度的控制.>选项2：强制一切都是相对的如果要强制每个单独...

Http地址–斜杠之间的url截取

weixin_45059911的博客

01-19

562

截取http地址斜杠中间的value

python路径单双斜杠、转义字符

qq_23126569的博客

02-20

2817

在Python中，记录路径时有以下几种写法，如：（大家都知道\n是换行的意思） report_dir1=r‘C:\Local\Programs\Python\Python35\Lib\n_test’ report_dir2=‘C:\Local\Programs\Python\Python35\Lib\n_test’ report_dir3=‘C:/Local/Programs/Python/Python35/Lib/n_test’ 这三个路径的写法是等价的： report_dir1中加入r后，使得编译器不会

UniError, if an URI contains an authority component

weixin_43560399的博客

04-16

242

UniError, if an URI contains an authority component

mac系统python读取文件路径_Python小技巧：3个处理文件路径的简单方法

weixin_39781930的博客

11-24

2396

原标题 | Python 3 Quick Tip: The easy way to deal with file paths on Windows, Mac and Linux作者 | Adam Geitgey译者 | 林肯二百一十三（西安交通大学）、Dooria几乎所有计算机在文件夹名称间使用的都是正斜杠，但微软Windows使用的是却反斜杠，这不免造成了编程的一个小烦恼。Windows fi...