python利用百度知道求答题答案

最新推荐文章于 2022-12-16 17:53:14 发布

sf131097

最新推荐文章于 2022-12-16 17:53:14 发布

阅读量550

点赞数 1

分类专栏：小练手

本文链接：https://blog.csdn.net/sf131097/article/details/79429892

版权

小练手专栏收录该内容

19 篇文章 0 订阅

订阅专栏

import json
import requests
from bs4 import BeautifulSoup as BS
from urllib import parse

#解析问题和答案
def open_question():
    with open("tounao.txt","r",encoding="utf-8") as f:
            res = f.read()
            js = json.loads(res)
            question = js["data"]["quiz"]
            options = js["data"]["options"]
            print(question)
    return question, options

#搜索百度知道，取出结果列表
def search(question):
    pages = [0, 10, 20]
    question = parse.quote(question.encode('gbk'))
    answers = []
    for page in pages:
    #"https://zhidao.baidu.com/search?lm=0&rn=10&pn={}&fr=search&ie=gbk&word={}"
        url ='https://zhidao.baidu.com/search?word={}&ie=gbk&site=-1&sites=0&date=0&pn={}&fr=search&lm=0&rn=10'.format(question,str(page))
        print(url)
        headers ={
            'User-Agent':'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)',
        }
        r = requests.get(url, headers = headers)
        r.encoding = 'gbk'
        soup = BS(r.text, "html.parser")
        #print(soup.contents)
        want = soup.find("div", id="wgt-list")
        wants = want.find_all("dl", class_ ='dl')

        for dl in wants:
                ans = dl.find("dd",class_="dd answer").text
                answers.append(ans)
    return answers

#分析结果
def work(options, answers):
    res = {option:0 for option in options}
    for option in options:
        for answer in answers:
            if answer.find(option)>=0:
                res[option]+=1
    print(res)
    return res

question, options = open_question()
answers = search(question)
work(options, answers)

sf131097

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python利用百度知道求答题答案

import jsonimport requestsfrom bs4 import BeautifulSoup as BSfrom urllib import parse#解析问题和答案def open_question(): with open("tounao.txt","r",encoding="utf-8") as f: res = f.read(...
复制链接

扫一扫

专栏目录