python--常用简单功能

Missing Sunshine

已于 2024-03-19 17:46:06 修改

阅读量568

点赞数 8

分类专栏： python基础文章标签： python 常用简单功能

于 2024-03-15 21:22:15 首次发布

本文链接：https://blog.csdn.net/qq_45830942/article/details/136750339

版权

python基础专栏收录该内容

3 篇文章 0 订阅

订阅专栏

os函数获取上层目录

# 获取当前目录
print(os.path.abspath(os.path.dirname(__file__)))
# 获取上级目录
print(os.path.abspath(os.path.dirname(os.path.dirname(__file__))))
print(os.path.abspath(os.path.dirname(os.getcwd())))
print(os.path.abspath(os.path.join(os.getcwd(), "..")))
# 获取上上级目录
print(os.path.abspath(os.path.join(os.getcwd(), "../..")))

中文转为 url 编码

from urllib.parse import quote
print(quote("xxxx"))

二次 xpath 提取

<div id="main">
      <div  id="main1">
               <ul>
                   <li>1</li>
                   <li>2</li>
                   <li>3</li>
                   <li>4</li>
           </ul>
       </div>
   </div>

div = html.xpath("//div[@id='main']")
li = div.xpath("div[@id='main1']/li")

scrapy在爬虫文件中导入 items 文件中的类

"""items.py"""
class FirstItem(scrapy.Item):
    shopName = scrapy.Field()
    start = scrapy.Field()
    commentNumber = scrapy.Field()
    avgPrice = scrapy.Field()
    shopType = scrapy.Field()
    shopAddress = scrapy.Field()
    isGroupBuy = scrapy.Field()
    groupBuyContent = scrapy.Field()

"""spider.py"""
from ..items import FirstItem

创建 Scrapy 项目

创建项目的命令:

scrapy startproject MySpider

cd MySpider

在已有 scrapy 项目下创建爬虫:
scrapy genspider example example.com

正则表达式提取数字

如何使用正则表达式提取一段文字中的数字?

import re
string = '共为您找到2765个"自助"相关商户'
matchRule = "\d+"
number = re.findall(matchRule, string)
print(number)

未完, 更新中…

Missing Sunshine

关注

8
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
python--常用简单功能

主要是收录一些自己平时做python程序时遇到的容易忘记但是常用的简单功能, 收录到一起, 方便自己使用.
复制链接

扫一扫

专栏目录