第一个小作品,不喜勿喷,新手

一个用python的乱七八糟模块搞出来的小作品

你是否曾对于观后感的写作而苦恼
你又是否曾想抄却不敢抄(其实是因为没看过)

你总是在想:
一篇文章全部复制——太假了
一片文章把它的段落打断——好像也差不多
多找几篇来混着抄——好累呀,段落中的句子还是一样的
多找几篇来抄,段落中的句子打乱,再乱序——好的,人没了(早死早超生)

而就是现在,我来了
是的,你没有用过的船新版本,大学生(中学生也可。。。)狗屁不通观后感生成器,那么此时大家就要疑问了,github上不是有一个大学生狗屁不通文章生成器吗,你这不是抄袭吗?那么我就在此声明,本人写的是一个小作品,与那个大作更定比不了(他那个好像有什么吊炸天的算法),我这个其实本质上就是一个爬虫,只不过优化了而已。。。(好低端),和大佬的作品杠都不搭,废话不多说,直接上代码!!!

#crowldouban.py
# -*- coding: utf-8 -*-
import re
import requests
import time
from bs4 import BeautifulSoup
import bs4
import os
import random
def gettext(url):
    try:
        kv={'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}
        r=requests.get(url,timeout=20,headers=kv)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        r.encoding = "utf-8"
        return r.text
    except:
        return ""

#短评链接 
def getcri(text):
    pat="https://movie.douban.com/review\/[0-9]*?\/\""
    result=re.compile(pat).findall(text)
    return result

#作品简介
def getbf(text):
    pat="\<p\>导演.*?分"
    result=re.compile(pat).findall(text)
    return result

def main():
    print("本作品作者董正宇QAQ")
    print("请输入你想要获取的观后感,输入格式:该影视的豆瓣链接")
    url=input()
    key={'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}
    txt=gettext(url)
    listf=getcri(txt)#各链接
    s=getbf(txt)#简介
    soup=BeautifulSoup(txt,"html.parser")
    title=soup.title.text.replace("\n","")
    title=title.replace(" ","")
    print(title)
    if not os.path.exists(title):
        os.mkdir(title)

    for i in listf:
        after=i[:-2]
        duanpin=gettext(after)
        pat="data-original=\"[\d]\"\>(.*?)\<\/div\>"
        result=re.findall(pat,duanpin,re.S)
        name="狗屁不通文章"
        content=re.sub("(\<br\>)+","\n",result[0])
        content_two=re.sub("(<p>)|(<\/p>)|(&nbsp;)+|-+","",content)
        each_par=content_two.split("\n")
        pargraph=random.sample(range(0,len(each_par)),len(each_par)-3)
        for i in pargraph:
            random_par=random.randint(0,5)
            with open(title+"/"+name+".txt","a",encoding="utf-8") as f:
                f.write(each_par[i])
                if random_par == 1:
                    f.write("\n")
    print("狗屁不通文章生成,别打我!!!")
main()

代码我就不解释了,因为有些是老前写的了,给大家讲一下使用说明:
1打开exe,输入该影视的豆瓣链接,之后回车
2会在该exe的目录下生成一个“狗屁不通文章.txt”
3直接点开就可以用了
easy~

更新了一下,附上pyinstaller打包好的exe链接
https://pan.baidu.com/s/1jZIhsckmUMEWZR5lka8ksQ
提取码:hrzy

第一次发博客,希望向大家多多学习。。。Orz Orz Orz

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值