python中使用yield来进行json格式化列表

最新推荐文章于 2022-12-16 18:00:18 发布

海爷爷

最新推荐文章于 2022-12-16 18:00:18 发布

阅读量776

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/zh54b5n64vn64654/article/details/88735303

版权

python 专栏收录该内容

23 篇文章 2 订阅

订阅专栏

def parse_one_page(html):
    #排名、图片、名称、主演、时间、评分
    pattern = re.compile('<dd>.*?board-index.*?>(\d+)</i>.*?alt=".*?src="(.*?)".*?name"><a'
                         + '.*?>(.*?)</a>.*?star">(.*?)</p>.*?releasetime">(.*?)</p>'
                         + '.*?integer">(.*?)</i>.*?fraction">(.*?)</i>.*?</dd>', re.S)
    items = re.findall(pattern,html)
    for item in items:
        yield {
            'index': item[0],
            'image': item[1],
            'title': item[2],
            'actor': item[3].strip()[3:],
            'time': item[4].strip()[5:],
            'score': item[5] + item[6]
        }

其中items是list列表，item是tuple元组

结果返回一个 <class 'generator'> 数据

    for item in parse_one_page(html):
        write_to_file(item)

通过for...in来使用数据

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

海爷爷

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python中使用yield来进行json格式化列表

def parse_one_page(html): #排名、图片、名称、主演、时间、评分 pattern = re.compile('<dd>.*?board-index.*?>(\d+)</i>.*?alt=".*?src="(.*?)".*?name"><a' + '.*?>(....
复制链接

扫一扫