基于Python+Spark的国产漫画推荐系统(爬虫+可视化大屏)_大数据推荐系统流程图

先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7

深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以添加V获取:vip204888 (备注大数据)
img

正文

    else:
        #非管理员权限的表,判断当前表字段名是否有userid
        if tablename!="users" and 'news'[:7]!='discuss'and "userid" in news.getallcolumn(news,news):
            req_dict["userid"] = request.session.get("params").get("id")

    #当列属性authTable有值(某个用户表)[该列的列名必须和该用户表的登陆字段名一致],则对应的表有个隐藏属性authTable为”是”,那么该用户查看该表信息时,只能查看自己的
    try:
        __authTables__=news.__authTables__
    except:
        __authTables__=None

    if __authTables__!=None and  __authTables__!={}:
        try:
            del req_dict['userid']
            # tablename=request.session.get("tablename")
            # if tablename=="users":
                # del req\_dict['userid']
            
        except:
            pass
        for authColumn,authTable in __authTables__.items():
            if authTable==tablename:
                params = request.session.get("params")
                req_dict[authColumn]=params.get(authColumn)
                username=params.get(authColumn)
                break

    q = Q()

    msg['data']['list'], msg['data']['currPage'], msg['data']['totalPage'], msg['data']['total'], \
    msg['data']['pageSize']  =news.page(news, news, req_dict, request, q)

    return JsonResponse(msg)

def news_autoSort(request):
‘’’
.智能推荐功能(表属性:[intelRecom(是/否)],新增clicktime[前端不显示该字段]字段(调用info/detail接口的时候更新),按clicktime排序查询)
主要信息列表(如商品列表,新闻列表)中使用,显示最近点击的或最新添加的5条记录就行
‘’’
if request.method in [“POST”, “GET”]:
msg = {“code”: normal_code, “msg”: mes.normal_code, “data”:{“currPage”:1,“totalPage”:1,“total”:1,“pageSize”:10,“list”:[]}}
req_dict = request.session.get(“req_dict”)
if “clicknum” in news.getallcolumn(news,news):
req_dict[‘sort’]=‘clicknum’
elif “browseduration” in news.getallcolumn(news,news):
req_dict[‘sort’]=‘browseduration’
else:
req_dict[‘sort’]=‘clicktime’
req_dict[‘order’]=‘desc’
msg[‘data’][‘list’], msg[‘data’][‘currPage’], msg[‘data’][‘totalPage’], msg[‘data’][‘total’],
msg[‘data’][‘pageSize’] = news.page(news,news, req_dict)

    return JsonResponse(msg)

def news_list(request):
‘’’
前台分页
‘’’
if request.method in [“POST”, “GET”]:
msg = {“code”: normal_code, “msg”: mes.normal_code, “data”:{“currPage”:1,“totalPage”:1,“total”:1,“pageSize”:10,“list”:[]}}
req_dict = request.session.get(“req_dict”)
if req_dict.contains(‘vipread’):
del req_dict[‘vipread’]

    #获取全部列名
    columns=  news.getallcolumn( news, news)
    #表属性[foreEndList]前台list:和后台默认的list列表页相似,只是摆在前台,否:指没有此页,是:表示有此页(不需要登陆即可查看),前要登:表示有此页且需要登陆后才能查看
    try:
        __foreEndList__=news.__foreEndList__
    except:
        __foreEndList__=None

    if __foreEndList__=="前要登":
        tablename=request.session.get("tablename")
        if tablename!="users" and 'userid' in columns:
            try:
                req_dict['userid']=request.session.get("params").get("id")
            except:
                pass
    #forrEndListAuth
    try:
        __foreEndListAuth__=news.__foreEndListAuth__
    except:
        __foreEndListAuth__=None


    #authSeparate
    try:
        __authSeparate__=news.__authSeparate__
    except:
        __authSeparate__=None

    if __foreEndListAuth__ =="是" and __authSeparate__=="是":
        tablename=request.session.get("tablename")
        if tablename!="users":
            req_dict['userid']=request.session.get("params",{"id":0}).get("id")

    tablename = request.session.get("tablename")
    if tablename == "users" and req_dict.get("userid") != None:#判断是否存在userid列名
        del req_dict["userid"]
    else:
        __isAdmin__ = None

        allModels = apps.get_app_config('main').get_models()
        for m in allModels:
            if m.__tablename__==tablename:

                try:
                    __isAdmin__ = m.__isAdmin__
                except:
                    __isAdmin__ = None
                break

        if __isAdmin__ == "是":
            if req_dict.get("userid"):
                # del req\_dict["userid"]
                pass
        else:
            #非管理员权限的表,判断当前表字段名是否有userid
            if "userid" in columns:
                try:
                    pass
                except:
                        pass
    #当列属性authTable有值(某个用户表)[该列的列名必须和该用户表的登陆字段名一致],则对应的表有个隐藏属性authTable为”是”,那么该用户查看该表信息时,只能查看自己的
    try:
        __authTables__=news.__authTables__
    except:
        __authTables__=None

    if __authTables__!=None and  __authTables__!={} and __foreEndListAuth__=="是":
        try:
            del req_dict['userid']
        except:
            pass
        for authColumn,authTable in __authTables__.items():
            if authTable==tablename:
                params = request.session.get("params")
                req_dict[authColumn]=params.get(authColumn)
                username=params.get(authColumn)
                break
    
    if news.__tablename__[:7]=="discuss":
        try:
            del req_dict['userid']
        except:
            pass


    q = Q()

    msg['data']['list'], msg['data']['currPage'], msg['data']['totalPage'], msg['data']['total'], \
    msg['data']['pageSize']  = news.page(news, news, req_dict, request, q)

    return JsonResponse(msg)

def news_save(request):
‘’’
后台新增
‘’’
if request.method in [“POST”, “GET”]:
msg = {“code”: normal_code, “msg”: mes.normal_code, “data”: {}}
req_dict = request.session.get(“req_dict”)
if ‘clicktime’ in req_dict.keys():
del req_dict[‘clicktime’]
tablename=request.session.get(“tablename”)
isAdmin = None
allModels = apps.get_app_config(‘main’).get_models()
for m in allModels:
if m.tablename==tablename:

            try:
                __isAdmin__ = m.__isAdmin__
            except:
                __isAdmin__ = None
            break


    #获取全部列名
    columns=  news.getallcolumn( news, news)
    if tablename!='users' and req_dict.get("userid")!=None and 'userid' in columns  and __isAdmin__!='是':
        params=request.session.get("params")
        req_dict['userid']=params.get('id')


    error= news.createbyreq(news,news, req_dict)
    if error!=None:
        msg['code'] = crud_error_code
        msg['msg'] = error

    return JsonResponse(msg)

def news_info(request,id_):
‘’’
‘’’
if request.method in [“POST”, “GET”]:
msg = {“code”: normal_code, “msg”: mes.normal_code, “data”: {}}

    data = news.getbyid(news,news, int(id_))
    if len(data)>0:
        msg['data']=data[0]
        if msg['data'].__contains__("reversetime"):
            msg['data']['reversetime'] = msg['data']['reversetime'].strftime("%Y-%m-%d %H:%M:%S")
    #浏览点击次数
    try:
        __browseClick__= news.__browseClick__
    except:
        __browseClick__=None

    if __browseClick__=="是"  and  "clicknum"  in news.getallcolumn(news,news):
        try:
            clicknum=int(data[0].get("clicknum",0))+1
        except:
            clicknum=0+1
        click_dict={"id":int(id_),"clicknum":clicknum}
        ret=news.updatebyparams(news,news,click_dict)
        if ret!=None:
            msg['code'] = crud_error_code
            msg['msg'] = ret
    return JsonResponse(msg)

def news_detail(request,id_):
‘’’
‘’’
if request.method in [“POST”, “GET”]:
msg = {“code”: normal_code, “msg”: mes.normal_code, “data”: {}}

    data =news.getbyid(news,news, int(id_))
    if len(data)>0:
        msg['data']=data[0]
        if msg['data'].__contains__("reversetime"):
            msg['data']['reversetime'] = msg['data']['reversetime'].strftime("%Y-%m-%d %H:%M:%S")

    #浏览点击次数
    try:
        __browseClick__= news.__browseClick__
    except:
        __browseClick__=None

    if __browseClick__=="是"   and  "clicknum"  in news.getallcolumn(news,news):
        try:
            clicknum=int(data[0].get("clicknum",0))+1
        except:
            clicknum=0+1
        click_dict={"id":int(id_),"clicknum":clicknum}

        ret=news.updatebyparams(news,news,click_dict)
        if ret!=None:
            msg['code'] = crud_error_code
            msg['msg'] = retfo
    return JsonResponse(msg)

def news_update(request):
‘’’
‘’’
if request.method in [“POST”, “GET”]:
msg = {“code”: normal_code, “msg”: mes.normal_code, “data”: {}}
req_dict = request.session.get(“req_dict”)
if req_dict.get(“mima”) and “mima” not in news.getallcolumn(news,news) :
del req_dict[“mima”]
if req_dict.get(“password”) and “password” not in news.getallcolumn(news,news) :
del req_dict[“password”]
try:
del req_dict[“clicknum”]
except:
pass

    error = news.updatebyparams(news, news, req_dict)
    if error!=None:
        msg['code'] = crud_error_code
        msg['msg'] = error

    return JsonResponse(msg)

def news_delete(request):
‘’’
批量删除
‘’’
if request.method in [“POST”, “GET”]:
msg = {“code”: normal_code, “msg”: mes.normal_code, “data”: {}}
req_dict = request.session.get(“req_dict”)

    error=news.deletes(news,

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
img

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

ion.get(“req_dict”)

    error=news.deletes(news,

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
[外链图片转存中…(img-A8QbHMHh-1713180206293)]

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 9
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
大数据基于用户画像电影推荐系统一个涉及PythonSpark和Hadoop等技术的复杂项目。在这个毕业源码案例设计中,源代码包含了多个部分的实现。 首先,Python作为主要的编程语言之一,负责数据的处理和分析。通过Python的数据处理库,我们可以对用户的个人画像数据进行清洗和整合,包括用户的年龄、性别、观影习惯等信息。同时,Python也可以用来编写推荐算法和模型评估的代码。 其次,Spark作为大数据处理和分析的引擎,在这个项目中起着重要的作用。我们可以利用Spark来处理海量的用户观影行为数据,进行分布式计算和数据处理,快速生成用户画像和推荐模型。Spark的机器学习库也可以用来构建推荐系统模型,根据用户的画像特征为其推荐电影。 最后,Hadoop作为大数据存储和管理的平台,负责存储用户的个人画像数据、电影信息数据以及用户观影行为数据。通过Hadoop分布式文件系统(HDFS)和MapReduce计算框架,可以实现数据的高效存储和处理。 在这个毕业源码案例设计中,源代码会包括数据预处理的代码、推荐算法的实现、模型评估的代码,以及与Hadoop和Spark的交互代码等。这些源代码的编写将涉及到Python的数据处理和建模技术Spark的分布式计算和机器学习技术,以及Hadoop的数据存储和管理技术。通过这些源代码的设计和实现,可以构建一个完整的大数据用户画像电影推荐系统

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值