自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 推荐系统

我们将从四个部分来讲诉推荐系统:第一部分就是推荐系统的产生背景,经历了怎样的发展;第二部分就是推荐系统的定义,到底这个推荐系统是个什么样的存在;第三部分推荐的必要性,根据推荐的强度决定要不要推荐,是不是所有的APP都需要这个推荐系统;第四部分是预备知识储备,就是学习推荐系统要具有哪些知识。产生背景人们的日常生活已经和各种各样的数据密不可分,例如在网络购物、 在线视频、在线音乐、新闻...

2019-10-06 15:13:06 553

原创 推荐系统算法:基于近邻协同过滤

基于近邻协同过滤

2019-10-06 15:12:09 2867

原创 推荐系统:冷启动问题

冷启动问题

2019-10-06 15:09:31 366

原创 实例:泰坦尼克号幸存者的预测

泰坦尼克号的沉没是世界上最严重的海难事故之一,今天我们通过分 类树模型来预测一下哪些⼈可能成为幸存者。数据集来着https://www.kaggle.com/c/titanic,数据集会随着代码一起提供给大家,大家可以在下载页面拿到,或者到群中询问。数据集包含两个csv格式文件,data为我们接下来要使用的数据,test为kaggle提供的测试集。

2019-10-05 19:04:40 1623

原创 Python基础

一、基础语法1.1标识符和关键字标识符:标志不同的词法单位,通俗讲就是名字。由一串字符构成,字母,数字,下划线,中文,并且不能以数字开头。大小写敏感,名字不能和关键字/保留字相同。关键字/保留字:已经被系统用或者留。执行下方命令可以查看关键字和保留字:1.2变量和常量变量是指运行过程中可以被修改的值。常量是指初始化后就保持不变的值。1.2.1 变量变量定义是通过对变量的第⼀次进...

2019-10-04 18:18:14 174

原创 MySQL存储过程案列:计算彩票金额

彩票游戏规则:彩票有10个刮奖区,每个刮奖区有一个图符和一个奖符,彩票中奖金额 = 同一个刮奖区内的(图符倍数*奖符金额),每张彩票售价5元计算金额流程说明计算过程步骤说明使用SQL语句计算彩票中奖金额流程:1. 建表、导数2. 创建10个图符文本字段以及文本字段赋值3. 分别为10个奖符文本以及文本字段赋值4. 创建图符对应表及奖符对应表5. 创建10个图符整数字段以...

2019-10-04 17:49:23 492

原创 MySQL:存储过程

使用存储过程的意义简化操作,减少冗余的操作步骤减少操作过程中的失误,提高效率概述存储过程是一条或者多条SQL语句的集合存储过程创建方法CREATE PROCEDURE sp_name ([proc_parameter])[characteristics…] routine_bodyCREATE PROCEDURE: 用来创建存储函数的关键字sp_name: 存储过程的名称p...

2019-10-03 21:36:04 128

原创 数据库的基本操作

创建数据库创建数据库:create database 数据库名称;查看创建好的数据库:show create database 数据库名称;查看所有数据库列表:show databases;删除数据库:drop database 数据库名称;创建数据表用SQL语句创建以下员工信息表创建不带约束条件的数据表创建带约束条件的数据表导入外部数据以al...

2019-10-03 21:14:54 180

原创 MySQL数据库的基本知识

数据库基本结构–数据库:数据库是表的集合,带有相关的数据。–表:一个表是多个字段的集合。– 字段:一个字段是一列数据,由字段名和记录组成。数据表– 数据库是由多个数据表构成的– 每张数据表存储多个字段– 每个字段由不同的字段名及记录构成,每个字段有自己的数据结构及约束条件数据类型数值类型– INT:有符号的和无符号的。有符号大小-214748364821474836...

2019-10-03 17:56:49 147

原创 机器学习:K-Means聚类算法

聚类算法是无监督类机器学习算法中最常用的一类,其目的是将数据划分成有意义或有用的组(也被称为簇)K-Means基本定义首先,选择K个初始质心,其中K是我们指定的参数,即所期望的簇的个数。每个点指派到最近的质心,而指派到一个质心的点集为一个簇。然后,根据指派到簇的点,更新每个簇的质心。重复指派和更新步骤,直到簇不发生变化,或等价地,直到质心不发省变化。K-Means的核心任务就是根据我们设定好...

2019-09-29 11:20:15 246

原创 Excel表格结构与表数据的区别

一、表格数据与表数据的区别1.表格数据是针对单元格的,表数据是针对某一列(字段的);2.列是字段,列名是字段名,行是记录,必须有字段名(而表格数据可以没有);3.一个字段只能有一种数据类型,数值或者文本;4.所有字段的记录数要一样,可以有缺失值等,但是总行数要一致;5.字段名必须唯一。二、表结构的优势1.大量数据的批量处理(处理速度快),比如表格结构的vlookup要占用大量计算机资...

2019-09-24 11:50:46 2120

原创 excel 函数

数学函数Int()函数是向下取整,就是将数字向下舍入到最接近的整数Mod(被除数,除数)函数是求余数Round(值,小数位数)是四舍五入Rounddown()向下取整Roundup(值,小数位数)向上取整Rand()是随机数函数,取从0-1之间的小数,但不包含1Randbetween(最小值,最大值)介于最大值和最小值之间产生的随机数Abs()求绝对值Sqrt()求平方根文本函...

2019-09-24 11:24:12 367

原创 excel 自定义参数(text函数)

1.自定义格式参数方式一:代码结构组成代码码分为四个部分,中间用“;”号分隔,具体如下:正数格式;负数格式;零格式;文本格式方式二:特定条件(最多只有三个条件)大于条件值;小于条件值;等于条件值;文本方式三:特定条件条件值1;条件值2;同时不满足条件值1,2;文本这三种形式,但可以统一为一种形式,满足条件1;满足条件2;不满足条件1、2;文本。如果不给条件则默认为:大于0;小于0;等...

2019-09-24 11:22:40 2280

原创 机器学习:逻辑回归

逻辑回归算法

2019-09-22 21:20:32 151

原创 机器学习:线性回归

线性回归算法

2019-09-22 18:43:55 353

原创 机器学习:决策树

决策树是一种层次分支结果,学习策略是分而治之,运用递归的方法

2019-09-20 14:00:21 381

原创 统计学:朴素贝叶斯

https://nbviewer.jupyter.org/github/xiaotaiyang08/123/blob/master/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F.ipynb

2019-09-20 11:18:39 206

原创 机器学习之K近邻算法--KNN

1.基本假设越相近越相似2.算法原理①算距离②找邻居③做分类

2019-09-20 09:31:27 503

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除