自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 基于上下文的推荐系统

基于上下文的推荐系统1 推荐系统上下文荐系统算法主要集中研究了如何联系用户兴趣和物品,将最符合用户兴趣的物品推荐给用户,但这些算法都忽略了一点,就是用户所处的上下文(context)。这些上下文包括用户访问推荐系统的时间、地点、心情等,对于提高推荐系统的推荐系统是非常重要的。推荐系统常见的上下文包括:时间上下文用户的兴趣可能成周期性(工作|下班、平日|周末)用户的兴趣是变化的物品具有时效性物品的流行度可能具有周期性建模需要考虑的地方:商品的时效性衰减程度用户的历史兴趣随时间衰减

2020-06-30 19:21:30 1331 1

原创 冷启动原理与项目实战

一、冷启动原理与项目实战1 冷启动原理与技术原理推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,因此大量的用户行为数据就称为推荐系统的重要组成部分和先决条件。很多在开始阶段就希望有个性化推荐应用的网站来说,在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。本质:商品或用户多、但行为历史数据或特征历史数据少。1.1 冷启动问题用户不确定性需求是客观存在的,在当今信息爆炸的时代,用户的不确定性需求更加明显,而推荐作为一种解决用户不确定

2020-06-30 19:15:56 1105

原创 推荐系统架构与机器学习基础理论

一、推荐系统架构与机器学习基础理论1 机器学习发展历程与架构原理1.1 发展历程大数据时代: 频率近似为概率计算机性能 :计算速度提升时间段发展时期主流技术二十世纪五十年代初至七十年代初推理期运用基于符号知识表示的演绎推理技术二十世纪七十年代中期至八十年代知识期基于符号知识表示,通过获取和利用领域知识来建立专家系统二十世纪八十年代至今学习期两大主流技术分别是符号主义学习和基于神经网络的连接主义学习1.2 优化问题与凸优化问题任何

2020-06-30 19:02:32 901

原创 海量数据的处理与挖掘

海量数据处理与挖掘1 Hadoop海量数据实现原理1.1 单点结构单点结构:也就是一台计算机,对于大数据,高并发来讲,我们所用的计算机的性能是远远不够的。而且单台及计算机对于我们数据来讲也是十分不安全的,当我们计算机发生损坏时,我们的数据就全都没有了,在我们做一些练习时可以使用,在真正的业务中是无法使用的。1.2 集群架构以及面临的问题1.2.1 集群架构集群技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益,其任务调度则是集群系统中

2020-06-30 18:44:26 1674

原创 机器学习及项目实战

机器学习1 机器学习体系介绍1.1 机器学习与传统编程传统编程在传统编程中,你需要对程序的行为进行硬编码。对于任何解决方案,第一个任务都是创建最合适的算法并编写代码。然后,必须设置输入参数,实际上,如果实现的算法是正确的,它将产生预期的结果。如下面流程图所示,在传统编程中,在对问题进行研究之后,对解决方案按照编写规则进行代码编写,之后对代码、算法进行评估。如果理想,正常运行从而产生预期的结果,如果不理想;分析错误重新对问题进行研究分析。机器学习在机器学习中,你将大量内容留给机器

2020-06-30 18:12:18 4732 1

原创 Python爬虫进阶--Scrapy框架原理及分布式爬虫构建

1 Scrapy简介1.1 概念Scrapy是由Python语言开发的一个快速、高层次的屏幕抓取和web信息抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试, Scrapy还使用了Twisted异步网络库来处理网络通讯。Scrapy最便捷的地方在于,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。通过scrapy框

2020-06-30 13:43:57 1045

原创 Python爬虫原理与常用模块--urllib与反爬策略

1 http协议1.1 简介1.HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web)服务器传输超文本到本地浏览器的传送协议。2.HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。1.2 工作原理HTTP协议工作于客户端-服务端架构上。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。Web服务器有:Apache服务器,I

2020-06-30 10:54:36 436

原创 Python爬虫原理与常用模块--数据提取与清洗策略

1 正则表达式1.1概念世界上信息非常多,而我们关注的信息有限。假如我们希望只提取出关注的数据,此时可以通过一些表达式进行提取,正则表达式就是其中一种进行数据筛选的表达式。正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z之间的字母)和特殊字符(称为"元字符")。正则表达式通常被用来匹配、检索、替换和分割那些符合某个模式(规则)的文本Python 自1.5版本起增加了re模块,它提供Perl风格的正则表达式模式。re 模块使 Python 语言拥有全

2020-06-30 10:26:05 768 1

原创 Python后台开发--Django高级与项目实战

1 Cookie1.1 Cookie机制在程序中,会话跟踪是很重要的事情。理论上,一个用户的所有请求操作都应该属于同一个会话,而另一个用户的所有请求操作则应该属于另一个会话,二者不能混淆。例如,用户A在超市购买的任何商品都应该放在A的购物车内,不论是用户A什么时间购买的,这都是属于同一个会话的,不能放入用户B或用户C的购物车内,这不属于同一个会话。而Web应用程序是使用HTTP协议传输数据的。HTTP协议是无状态的协议。一旦数据交换完毕,客户端与服务器端的连接就会关闭,再次交换数据需要建立新的连接。这

2020-06-29 22:37:06 762

原创 Python后台开发基础--模型类实现

1 ORM原理与数据库配置1.1 模块安装代码部分:pip install pymysql pip install mysqlclient1.2 模块安装常见问题time out 超时解决方案: pip install 包名 --user-i https://pypi.tuna.tsinghua.edu.cn/simple缺少c ++ 插件解决方案:https://www.jb51.net/article/151033.htm1.3 Pycharm连接 Mysql保证pych

2020-06-29 21:33:22 411

原创 Python后台开发基础--路由与模板

Web原理介绍访问网站请求流程及其原理Django可以更快地构建更好的Web应用程序并减少代码。Django官方网址2 Django环境搭建和入门案例2.1 环境搭建代码部分:pip install django==2.2 pip install pillow2.2 环境搭建步骤2.2.1 创建项目2.2.1.1第一种方式注:使用的Pycharm必须是专业版(社区版有很多功能不支持,例如数据库可视化)选择Python环境解释器在第一周环境搭建中有讲述2.2.1.2

2020-06-29 21:21:56 466

原创 Python后台开发基础--Web前端基础

1 Html1.1 Html介绍HTML是 HyperText Mark-upLanguage 的首字母简写,意思是超文本标记语言,HTML不是一种编程语言,而是一种标记语言超文本指的是超链接,标记指的是标签,是一种用来制作网页的语言,这种语言由一个个的标签组成,用这种语言制作的文件保存的是一个文本文件,文件的扩展名为.html或者.htm,html文档也叫Web页面,其实就是一个网页,html文件用编辑器打开显示的是文本,可以用文本的方式编辑它,如果用浏览器打开,浏览器会按照标签描述内容将

2020-06-29 20:17:19 666

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除