关闭。此问题不符合堆栈溢出准则。它当前不接受答案。
想改善这个问题吗?更新问题,使其成为Stack Overflow的主题。
7年前关闭。
我正在使用xpath抓取网页的某些数据..结果如下
['\r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t', u'\r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\tRs\xa021790 \r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t', u'\r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tRs\xa023851\r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t', u'\r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tRs\xa023905\r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t', u'\r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tRs\xa026570\r\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t']
现在我只需要从列表中的条目中提取整数(如果存在,则为0)。
预期的输出:
[0, 21790, 0, 23851, 0, 23905, 0, 26570]
我避免使用“ regex”或任何其他模块。
解决方案
您需要删除空间,然后可以在\xa0不间断空间上进行分割:
[0 if not v.strip() else int