[Python 应用:爬虫] Selelium 之 css selectors

文本内容参考:https://saucelabs.com/resources/articles/selenium-tips-css-selectors

 

CSS Selector 是什么?

简单说就是一种定位元素的方式,直接看下面用法说明。

 

CSS Selector 方式怎么用?

简单用法

 ------------------------------------------------------------------------------------------------------------------------------------

 

直接关系子元素(下一层级)

在XPATH里面,直接关系子元素是用‘/’来定义,在CSS中用的是">"

XPath: //div/a

CSS: div > a

 


子元素(不一定是下一层级的)

XPath: //div//a

CSS: div a

 

ID

在XPATH中元素通过Id来定位是用“[@id='example']” 来表示的,但是这CSS 中直接用“#” 表示

XPath: //div[@id='example']

CSS: #example

 

Class

在XPATH中元素通过Id来定位是用“[@class='example']” 来表示的,但是这CSS 中直接用“.” 表示;

 XPath: //div[@class='example']

CSS: .example

 

进阶用法

-------------------------------------------------------------------------------------------------------------------------------------------

 下一个同级元素

这种方式对于定位一组元素很有用。这种方式可以找到位于同一个父元素下的下一个相邻元素。看个例子

<form class = "form-signin" role = "form" action = "/index.php" method = "post">

<h4 class = "form-signin-heading"></h4> 

<input type = "text" class = "form-control" id = "username" name = "username" placeholder = "username" required autofocus></br> 

<input type = "password" class = "form-control" id = "password" name = "password" placeholder = "password" required> 

<p> 

<button class = "btn btn-lg btn-primary btn-block radius" type = "submit" name = "login">Login</button> 

</form> 

 

要找到username 后面的元素,可以通过以下方式。这种方式如果元素顺序换了的话,定位的元素也会不一样。

CSS: #username + input

 

对比来看XPATH通过这种方式定位时使用的语法

XPATH: //input[@id='username']/following-sibling::input[1]

 

元素的属性值

如果我们不关心元素的顺序,我们可以通过元素的属性值来定位元素,简单如下:

XPATH: //input[@name='username']

CSS: input[name='username']

如果想要更具体确切的话,可以在后面增加更多的属性值,如下:

XPATH: //input[@name='login'and @type='submit']

CSS: input[name='login'][type='submit'

 

选择特定的匹配

除了上面的方法外,CSS Selector 提供更为精细的定位方式。如下网页,如果我们想要定位第四个li元素同时不用考虑其他元素。这个时候

我们应该使用 nth-child 或者 nth-of-type的方式。

如果我们想要定位到第四个li元素,我们可以通过 nth-of-type的方式,如下:

CSS: #recordlist li:nth-of-type(4)

如果我们想定位到到第四个元素而且第四个元素要为li的情况,就要通过下面的方式,下面的用法定位到的是 Car 元素。

CSS: #recordlist li:nth-child(4)

注意如果你不指定第四个元素的类型,这样的话,默认就会返回第四个元素。如下

CSS: #recordlist *:nth-child(4)

 

部分字符匹配

CSS 可以通过使用Id Name等方式的时候只匹配部分字符(匹配只修改了部分字符的元素很好用。表达的时候会用到^=, $=, 或者 *=。

^= 是匹配前缀用的,例如:

CSS: a[id^='id_prefix_']

Id 以 id_prefix_ 开头的元素就可以匹配到。

$= 是匹配后缀用的,例如:

CSS: a[id$='_id_sufix']

Id 以 _id_sufix 结尾的元素就可以匹配到。

*= 是只要包含内容就行,例如:

CSS: a[id*='id_pattern']

Id 中只要包含文本id_pattern 的元素就可以匹配到。

 

内部文本匹配(强力推荐)

这种方式会更为有用,因为只有元素中包含定义的文本内容就可以被定位到,不管这个文本内容在元素中代表什么含义。这种方式用contain来表示,例如:

CSS: a:contains('Log Out')

这样的话,不管哪个元素包含“Log Out”,不管这个元素在什么位置,都会被定位到。

 

 

转载于:https://www.cnblogs.com/dream-on-all-in/p/11135370.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在 Python 中,实现 Socket 的高并发可以使用多种方式,其中 `select` 和 `selectors` 是比较常用的两种方式。 1. 使用 `select` 实现 Socket 并发 使用 `select` 实现 Socket 的高并发,可以按照以下步骤进行: 1) 创建一个 Socket,设置为非阻塞模式,如下所示: ``` import socket server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM) server_socket.setblocking(False) ``` 2) 绑定 Socket 地址和端口,并开始监听,如下所示: ``` server_socket.bind(('localhost', 8000)) server_socket.listen(128) ``` 3) 创建一个 `select` 对象,并将监听的 Socket 加入到该对象中,如下所示: ``` import select rlist = [server_socket] wlist = [] xlist = [] while True: rs, ws, xs = select.select(rlist, wlist, xlist) for r in rs: if r is server_socket: conn, addr = server_socket.accept() conn.setblocking(False) rlist.append(conn) else: data = r.recv(1024) if data: # 处理接收到的数据 else: r.close() rlist.remove(r) ``` 4) 在 `select` 对象的 `select()` 方法中,使用 `rlist` 参数来监听读事件,使用 `wlist` 参数来监听写事件,使用 `xlist` 参数来监听异常事件。如果有 Socket 可读、可写或者出现异常,`select()` 方法就会返回对应的列表。 5) 在返回的可读列表中,如果是监听的 Server Socket,说明有新的连接请求,需要调用 `accept()` 方法接收连接,并将新的 Socket 加入到 `rlist` 列表中;如果是普通的 Socket,说明有数据到来,需要调用 `recv()` 方法接收数据,并进行相应的处理。 2. 使用 `selectors` 实现 Socket 并发 使用 `selectors` 实现 Socket 的高并发,可以按照以下步骤进行: 1) 创建一个 Socket,并将其注册到 `selectors` 对象中,如下所示: ``` import selectors import socket sel = selectors.DefaultSelector() server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM) server_socket.bind(('localhost', 8000)) server_socket.listen(128) server_socket.setblocking(False) sel.register(server_socket, selectors.EVENT_READ, data=None) ``` 2) 在 `selectors` 对象的 `select()` 方法中等待事件,如下所示: ``` while True: events = sel.select(timeout=None) for key, mask in events: if key.data is None: # 处理 Server Socket 的连接请求 else: # 处理普通 Socket 的数据读取和写入 ``` 3) 注册 Server Socket 的时候,将 `data` 参数设置为 `None`,在处理连接请求时,可以将 `data` 参数设置为新连接的 Socket 对象;在处理普通 Socket 的数据读取和写入时,可以通过 `key.data` 获取到该 Socket 对应的数据。 4) 在处理普通 Socket 的数据读取和写入时,可以通过 `mask` 参数来判断是读事件还是写事件,如果是读事件,就调用 `recv()` 方法接收数据,如果是写事件,就调用 `send()` 方法发送数据。 以上就是使用 `select` 和 `selectors` 实现 Socket 并发的步骤,具体实现时需要根据具体情况进行修改。 ### 回答2: 在Python中,要实现高并发的socket编程,可以使用selectors模块。 selectors模块提供了一种应对I/O多路复用的高效方式,它基于select或者epoll等系统调用,可以同时监视多个文件对象(如socket),并在有数据到来时进行处理。 首先,我们需要创建一个selectors对象,并注册要监视的socket对象。可以使用默认的selectors.DefaultSelector()来创建一个selector对象。 接下来,可以使用selectors对象的register方法来注册要监视的socket对象。register方法接受一个socket对象和一个事件类型(如selectors.EVENT_READ用于读事件),并将其添加到selector对象的监视列表中。 然后,可以使用selectors对象的select方法来等待事件的发生。select方法会一直阻塞直到有事件发生,并返回一个事件列表。 最后,可以遍历事件列表,根据事件的类型来处理不同的操作。例如,如果事件类型为selectors.EVENT_READ,则可以调用socket对象的recv方法来接收数据。 使用selectors模块能够实现高并发的socket编程,可以提高程序的性能和效率。同时,selectors模块还提供了一些其他功能,比如超时处理、取消注册等,可以根据实际需要进行使用。 总之,selectors模块是Python中实现socket并发的一种高效方式,通过使用其提供的方法和功能,可以轻松实现高并发的socket编程。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值