python实用脚本 知乎_Python采用Django制作简易的知乎日报API

现在我主要教大家如何去实战,做一个简易的知乎日报API

首先你要熟悉django的基本用法,会写模型,会写视图函数,会配置url。

1.配置字符编码

因为我们等一下要使用中文,所以要先设好字符编码

在settings.py里将LANGUAGE_CODE设为'zh-CN'

然后添加这两行

FILE_CHARSET='utf-8'

DEFAULT_CHARSET='utf-8'

还要进入到数据库

依次输入

set character_set_client=utf8 ;

set character_set_connection=utf8 ;

set character_set_database=utf8 ;

set character_set_results=utf8 ;

set character_set_server=utf8 ;

set character_set_system=utf8 ;

设置完成之后,输入

show variables like 'character%';

201683154523006.jpg?201673154538

对照一下结果是否是这样

2.然后开始写模型

class News(models.Model):

created = models.DateTimeField(auto_now_add=True)

title = models.CharField(max_length=100)

image = models.CharField(max_length=100)

theme_id =models.IntegerField()

class Meta:

ordering = ('created',)

def __unicode__(self):

return self.title

class NewsDetail(models.Model):

news = models.ForeignKey(News)

created = models.DateTimeField(auto_now_add=True)

content = models.CharField(max_length=1000)

image = models.CharField(max_length=99)

class Meta:

ordering = ('created',)

def __unicode__(self):

return self.news.title

这里不难理解,这里我分两层,第一层是概括,第二层是详细内容,然后以概括的作为外键

概括主要包含标题,配图地址和主题

详细内容包括内容和配图地址

3.将模式序列化

这是rest_framework非常强大的一点

在app里新建一个serializers.py,然后创建继承自ModelSerializer的类

from rest_framework import serializers

class NewsSerializer(serializers.ModelSerializer):

class Meta:

model = News

fields = ('id', 'title', 'image', 'theme_id')

class NewsDetailSerializer(serializers.ModelSerializer):

class Meta:

model = NewsDetail

fields = ('id', 'image', 'content')

model为模型,fields为你想要查询显示的字段

4.然后再写视图函数

rest_framework.renderers中的JSONRenderer可以将对象渲染为json形式的字符串

from rest_framework.renderers import JSONRenderer

class JSONResponse(HttpResponse):

"""

用于返回JSON数据.

"""

def __init__(self, data, **kwargs):

content = JSONRenderer().render(data)

kwargs['content_type'] = 'application/json'

content='{"news":'+content+'}'

super(JSONResponse, self).__init__(content, **kwargs)

我们在字符串外面在包一个news,这样获取比较方便

如何像知乎日报的那样获取最新的几个news呢

@csrf_exempt

def latest_news(request):

"""

展示最新的10个news.

"""

if request.method == 'GET':

news = News.objects.all()[:10]

serializer = NewsSerializer(news, many=True)

return JSONResponse(serializer.data)

因为返回的是一个集合所以NewsSerializer的many参数要设为True

返回某个主题的前几个news

@csrf_exempt

def theme_news(request,theme_id):

"""

展示某个主题的前10个news.

"""

if request.method == 'GET':

news=News.objects.filter(theme_id=theme_id)[:10]

serializer = NewsSerializer(news, many=True)

return JSONResponse(serializer.data)

返回某个id的news的详细内容

@csrf_exempt

def news_detail(request,news_id):

"""

显示某个news的内容.

"""

try:

news = NewsDetail.objects.get(news_id=news_id)

except Snippet.DoesNotExist:

return HttpResponse(status=404)

if request.method == 'GET':

serializer = NewsDetailSerializer(news)

# print serializer.data

return JSONResponse(serializer.data)

这里获取的是单个对象所以不用加many参数

5.配置url

urlpatterns = [

...

url(r'^api/4/news/latest$', latest_news),

url(r'^api/4/news/theme/(?P[0-9]+)/$', theme_news),

url(r'^api/4/news/(?P[0-9]+)/$', news_detail),

]

括号包住的是要传入的参数,逗号后面的是匹配url成功后要执行的视图函数

括号里面有一些正则表达式,自己可以去百度搜一下怎么写

最后就可以把项目跑起来

效果如下

2016080315484118.jpg

2016080315484119.jpg

2016080315484120.jpg

本文标题: Python采用Django制作简易的知乎日报API

本文地址: http://www.cppcns.com/jiaoben/python/158903.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
需要使用Python编程语言来爬取知乎问题下的所有回答。具体步骤如下: 1. 首先需要安装Python的requests和beautifulsoup4库,用于发送HTTP请求和解析HTML页面。 2. 获取知乎问题页面的URL,可以手动复制粘贴,或者使用爬虫自动获取。 3. 使用requests库发送GET请求,获取知乎问题页面的HTML源代码。 4. 使用beautifulsoup4库解析HTML源代码,获取所有回答的信息。 5. 对每个回答进行解析,获取回答的文本、作者、点赞数、评论数等信息。 6. 将获取到的信息存储到本地文件或数据库中。 下面是一段示例代码,可以爬取知乎某个问题下的所有回答: ```python import requests from bs4 import BeautifulSoup # 知乎问题页面的URL url = 'https://www.zhihu.com/question/xxxxxx' # 发送GET请求,获取页面HTML源代码 response = requests.get(url) html = response.text # 解析HTML页面,获取所有回答的信息 soup = BeautifulSoup(html, 'html.parser') answers = soup.find_all('div', class_='List-item') # 遍历每个回答,解析并存储信息 for answer in answers: # 解析回答文本、作者、点赞数、评论数等信息 text = answer.find('div', class_='RichContent-inner').get_text() author = answer.find('div', class_='ContentItem-head').get_text() upvotes = answer.find('button', class_='Button VoteButton VoteButton--up').get_text() comments = answer.find('button', class_='Button ContentItem-action Button--plain Button--withIcon Button--hoverCard').get_text() # 将信息存储到本地文件或数据库中 with open('answers.txt', 'a', encoding='utf-8') as f: f.write(f'{author}\n{text}\n赞同数:{upvotes} 评论数:{comments}\n\n') ``` 需要注意的是,爬取知乎数据属于个人行为,需要遵守知乎的相关规定,不得用于商业用途。另外,爬取速度也需要适当控制,避免给服务器造成过大的负担。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值