利用python搜索腾讯课堂课程

最新推荐文章于 2021-02-27 15:08:41 发布

weixin_43964993

最新推荐文章于 2021-02-27 15:08:41 发布

阅读量664

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/weixin_43964993/article/details/108187305

版权

python 专栏收录该内容

40 篇文章 4 订阅

订阅专栏

导入库

import requests
from bs4 import BeautifulSoup
import bs4

获取网页信息

def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return ""

获得课程名称并输出

def getCourseName(key, url):
    html = getHTMLText(url)
    soup = BeautifulSoup(html, "html.parser")
    title = soup.title.string[0:-12]
    if key in title:
        print('\n'+title+'   '+url+'\n')
        CourseListString = '|' + title + '|' + '|' + '[点击进入]('+ url + ')|\n'
        with open('result.md', 'a', encoding = 'UTF-8') as f:
            f.write(CourseListString)

循环搜索

'''
start  起始网址代码（包括start）
end    结束网址代码（不包括end）
'''
def printUnivList(start, end, key):
    with open('result.md', 'a', encoding = 'UTF-8') as f:
        f.write('|课程名称|课程网址|\n|:----:|:----:|\n')
    for n in range(start,end):
        try:
            print("\r进度：{:7}/{:7}".format(n-start,end-start),end='')
            url = 'https://ke.qq.com/course/{}'.format(n)
            getCourseName(key, url)
        except:
            continue

执行文件

key = input('请输入关键字：')
print('开始爬取。。。')
printUnivList(1000000, 1010000, key)
input('爬取结束，按任意键退出。。。')

附录：源文件

点击此处下载

附录：部分结果演示

bfj

weixin_43964993

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
利用python搜索腾讯课堂课程

目录导入库获取网页信息获得课程名称并输出循环搜索执行文件附录：源文件附录：部分结果演示导入库import requestsfrom bs4 import BeautifulSoupimport bs4获取网页信息def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding
复制链接

扫一扫