Python 爬虫爬取coom 课程评论

RUTU

已于 2024-05-21 19:08:15 修改

阅读量249

点赞数 3

文章标签： python 爬虫开发语言

于 2024-05-21 19:03:00 首次发布

本文链接：https://blog.csdn.net/m0_54650650/article/details/139100039

版权

# -*- coding:gbk -*-

import json
from urllib import request,parse

headers={'User-Agent':'浏览器的User-Agent'
, 'cookie': '你的Cookie' }


def get_couse_count(course_key):
    url='http://www.icourse163.org/web/j/mocSearchBean.searchCourse.rpc?csrfKey=4c029bb4c27e4aaaad9ca7fb694b2396'
    data="mocCourseQueryVo={'keyword':'%s','pageIndex':1,'highlight':'true','orderBy':0,'stats':30,'pageSize':20}"%course_key
    data=bytes(data,'utf-8')
    req=request.Request(url,headers=headers,method='POST')
    rep=request.urlopen(req,data=data)
    result=json.loads(rep.read().decode('utf-8'))
    if result['result']['query']==None: 
        print("没有查询到相关课程!!!")
        return None
    totalcount=result['result']['query']['totlePageCount']
    course_lists=[]
    index=0
    for i in range(1,totalcount+1):
        data="mocCourseQueryVo={'keyword':'%s','pageIndex':%s,'highlight':'true','orderBy':0,'stats':30,'pageSize':20}"%(course_key,i)
        data=bytes(data,'utf-8')
        req=request.Request(url,headers=headers,method='POST')
        rep=request.urlopen(req,data=data)
        result=json.loads(rep.read().decode('utf-8'))
        lists=result['result']['list']
        for course in lists:
            courses={}
            courses['id']=index
            courses['course_id']=course['courseId']
            courses['course_teacher']=course['highlightTeacherNames']
            courses['course_name']=course['highlightName']
            print("id:{}，课程id：{},教师名：{}，课程名：{}".format( courses['id'],courses['course_id'],courses['course_teacher'],courses['course_name']))
            course_lists.append(courses)
            index+=1    
    return  course_lists       


def get_comment(course_id):
    url='https://kaoyan.icourse163.org/web/j/kaoyanCourseBean.getCourseEvaluatePaginationByCourseId.rpc?csrfKey=4c029bb4c27e4aaaad9ca7fb694b2396'
    data='courseId=%s&pageIndex=1&pageSize=20&orderBy=3'%course_id
    data=bytes(data,'utf-8')
    req=request.Request(url,headers=headers,method='POST')
    rep=request.urlopen(req,data=data)
    result=json.loads(rep.read().decode('utf-8'))
    if result['result']['list']==[]:
        print('该课程还没有评论')
        return None
    
    totlePage=result['result']['query']['totlePageCount']
    for i in range(1,totlePage+1):
        data='courseId=%s&pageIndex=%s&pageSize=20&orderBy=3'%(course_id,i)
        data=bytes(data,'utf-8')
        req=request.Request(url,headers=headers,method='POST')
        rep=request.urlopen(req,data=data)
        result=json.loads(rep.read().decode('utf-8'))
        comments=result['result']['list']
        for com in comments:
            print("用户名：{}，评论：{}".format(com['userNickName'],com['content']))



if __name__ == "__main__":
    while True:
        print("请输入课程名或教师(输入-1退出):")
        course_key=input()
        if course_key=='-1':
            break;
        course_lists=get_couse_count(course_key)
        if course_lists==None: continue
        idh=0
        while True:
            print("请输入您要查看评论的课程编号id(退回上一步输入 字母b):")
            idh=input()
            if idh=='b':
                break
            idh=int(idh)
            course=course_lists[idh]
            if course==None: continue
            print("课程名："+course['course_name']+",评论如下:")
            get_comment(course['course_id'])