自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 MySQL与Python最详细的使用文档

MySQL数据库1.1 MySQL简介Mysql是最流行的RDBMS(Relational Database Management System:关系数据库管理系统),特别是在WEB应用方面。数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,每个数据库都有一个或多个不同的API用于创建,访问,管理,搜索和复制所保存的数据。所谓的关系型数据库,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。RDBMS即关系数据库管理系统(Relationa

2020-11-04 15:22:52 42

原创 基于上下文的推荐系统

基于上下文的推荐系统1 推荐系统上下文荐系统算法主要集中研究了如何联系用户兴趣和物品,将最符合用户兴趣的物品推荐给用户,但这些算法都忽略了一点,就是用户所处的上下文(context)。这些上下文包括用户访问推荐系统的时间、地点、心情等,对于提高推荐系统的推荐系统是非常重要的。推荐系统常见的上下文包括:时间上下文用户的兴趣可能成周期性(工作|下班、平日|周末)用户的兴趣是变化的物品具有时效性物品的流行度可能具有周期性建模需要考虑的地方:商品的时效性衰减程度用户的历史兴趣随时间衰减

2020-11-04 15:18:44 16

原创 推荐系统架构与机器学习基础理论

一、推荐系统架构与机器学习基础理论1 机器学习发展历程与架构原理1.1 发展历程大数据时代: 频率近似为概率计算机性能 :计算速度提升时间段发展时期主流技术二十世纪五十年代初至七十年代初推理期运用基于符号知识表示的演绎推理技术二十世纪七十年代中期至八十年代知识期基于符号知识表示,通过获取和利用领域知识来建立专家系统二十世纪八十年代至今学习期两大主流技术分别是符号主义学习和基于神经网络的连接主义学习1.2 优化问题与凸优化问题任何

2020-11-04 15:18:05 276

原创 海量数据的处理与挖掘

海量数据处理与挖掘1 Hadoop海量数据实现原理1.1 单点结构单点结构:也就是一台计算机,对于大数据,高并发来讲,我们所用的计算机的性能是远远不够的。而且单台及计算机对于我们数据来讲也是十分不安全的,当我们计算机发生损坏时,我们的数据就全都没有了,在我们做一些练习时可以使用,在真正的业务中是无法使用的。1.2 集群架构以及面临的问题1.2.1 集群架构集群技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益,其任务调度则是集群系统中

2020-11-04 15:17:14 57

原创 机器学习及项目实战

机器学习1 机器学习体系介绍1.1 机器学习与传统编程传统编程在传统编程中,你需要对程序的行为进行硬编码。对于任何解决方案,第一个任务都是创建最合适的算法并编写代码。然后,必须设置输入参数,实际上,如果实现的算法是正确的,它将产生预期的结果。如下面流程图所示,在传统编程中,在对问题进行研究之后,对解决方案按照编写规则进行代码编写,之后对代码、算法进行评估。如果理想,正常运行从而产生预期的结果,如果不理想;分析错误重新对问题进行研究分析。机器学习在机器学习中,你将大量内容留给机器

2020-11-04 15:08:31 32

原创 特征工程

特征工程1 机器学习机器学习简单来说就是选择一种学习算法,从数据中学习并建立成模型来对新的数据进行预测的计算机科学 。机器学习是人工智能的一个分支。人工智能的研究是从以“推理”为重点—以“知识”为重点—再到以“学习”为重点,一条自然、清晰的脉络。机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。机器学习算法是一类从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测的算法。我们的数据量越来越多,硬件越来越强悍。急需要解放人的生产力,自动去寻找数据的规律。解决更多专业领

2020-11-04 15:07:37 292

原创 数据科学原理与数据处理

数据科学原理与数据处理1 Python行业分析通过Stack OverFlow专业网站的大数据统计,Python相关技术模块访问量最大的簇是数据科学相关,然后才是后台开发。1.1 数据处理流程1.2 数据科学岗位分析2 数据分析好助手Jupyter notebookJupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 m

2020-11-04 15:07:13 129

原创 Python推荐系统——冷启动原理与项目实战

一、冷启动原理与项目实战1 冷启动原理与技术原理推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,因此大量的用户行为数据就称为推荐系统的重要组成部分和先决条件。很多在开始阶段就希望有个性化推荐应用的网站来说,在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。本质:商品或用户多、但行为历史数据或特征历史数据少。1.1 冷启动问题用户不确定性需求是客观存在的,在当今信息爆炸的时代,用户的不确定性需求更加明显,而推荐作为一种解决用户不确定

2020-09-22 13:59:11 29

原创 Python爬虫进阶——Scrapy框架原理及分布式爬虫构建

1 Scrapy简介1.1 概念Scrapy是由Python语言开发的一个快速、高层次的屏幕抓取和web信息抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试, Scrapy还使用了Twisted异步网络库来处理网络通讯。Scrapy最便捷的地方在于,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。通过scrapy框

2020-09-22 13:58:18 31

原创 Python爬虫原理与常用模块——数据提取与清洗策略

1 正则表达式1.1概念世界上信息非常多,而我们关注的信息有限。假如我们希望只提取出关注的数据,此时可以通过一些表达式进行提取,正则表达式就是其中一种进行数据筛选的表达式。正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z之间的字母)和特殊字符(称为"元字符")。正则表达式通常被用来匹配、检索、替换和分割那些符合某个模式(规则)的文本Python 自1.5版本起增加了re模块,它提供Perl风格的正则表达式模式。re 模块使 Python 语言拥有全

2020-09-22 13:57:45 58

原创 Python爬虫原理与常用模块——urllib与反爬策略

1 http协议1.1 简介1.HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web)服务器传输超文本到本地浏览器的传送协议。2.HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。1.2 工作原理HTTP协议工作于客户端-服务端架构上。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。Web服务器有:Apache服务器,I

2020-09-22 13:57:13 88

原创 Python后台开发基础——路由与模板

Web原理介绍访问网站请求流程及其原理Django可以更快地构建更好的Web应用程序并减少代码。Django官方网址2 Django环境搭建和入门案例2.1 环境搭建代码部分:pip install django==2.2 pip install pillow2.2 环境搭建步骤2.2.1 创建项目2.2.1.1第一种方式注:使用的Pycharm必须是专业版(社区版有很多功能不支持,例如数据库可视化)选择Python环境解释器在第一周环境搭建中有讲述2.2.1.2

2020-09-22 13:56:20 25

原创 Python后台开发基础——模型类实现

1 ORM原理与数据库配置1.1 模块安装代码部分:pip install pymysql pip install mysqlclient1.2 模块安装常见问题time out 超时解决方案: pip install 包名 --user-i https://pypi.tuna.tsinghua.edu.cn/simple缺少c ++ 插件解决方案:https://www.jb51.net/article/151033.htm1.3 Pycharm连接 Mysql保证pych

2020-09-22 13:55:36 31

原创 Python后台开发基础——Web前端基础

1 Html1.1 Html介绍HTML是 HyperText Mark-upLanguage 的首字母简写,意思是超文本标记语言,HTML不是一种编程语言,而是一种标记语言超文本指的是超链接,标记指的是标签,是一种用来制作网页的语言,这种语言由一个个的标签组成,用这种语言制作的文件保存的是一个文本文件,文件的扩展名为.html或者.htm,html文档也叫Web页面,其实就是一个网页,html文件用编辑器打开显示的是文本,可以用文本的方式编辑它,如果用浏览器打开,浏览器会按照标签描述内容将

2020-09-22 13:54:49 50

原创 Python后台开发——Django高级与项目实战

1 Cookie1.1 Cookie机制在程序中,会话跟踪是很重要的事情。理论上,一个用户的所有请求操作都应该属于同一个会话,而另一个用户的所有请求操作则应该属于另一个会话,二者不能混淆。例如,用户A在超市购买的任何商品都应该放在A的购物车内,不论是用户A什么时间购买的,这都是属于同一个会话的,不能放入用户B或用户C的购物车内,这不属于同一个会话。而Web应用程序是使用HTTP协议传输数据的。HTTP协议是无状态的协议。一旦数据交换完毕,客户端与服务器端的连接就会关闭,再次交换数据需要建立新的连接。这

2020-09-22 13:53:55 25

原创 Python基础——程序设计与数据结构

二 程序设计与数据结构1 万物皆对象、Python不例外1.1 面向对象编程基本概念:Python从设计之初就已经是一门面向对象的语言,比如Java, C#, Javascript,C++都是典型的面向对象语言.C语言和汇编语言是典型的面向过程语言.面向过程的语言更倾向于功能的实现与封装,体现计算机实现功能面向对象的语言更倾向于业务层面的流程实现,体现解决具体事物流程现代计算机程序都是面向过程和面向对象的结合使用,面向对象同样也支持面向过程1.1.1 面向对象技术简介类(Class)

2020-09-22 13:50:55 95

原创 Python基础——Python语言家族

在这里插入图片描述一、Python语言家族1 Introduction1.1 Python 简介Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。简单来说,Python是一门编程语言,帮助我们更好的与计算机沟通,功能全面、易学易用、可拓展语言,所以说,人生苦短,我学Python。Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构。Python 是一种解释型高级语言: 这意味着开发过程中没有

2020-09-22 13:48:55 79

空空如也

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除