自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

原创 运营体系搭建

计量法更精准,权重法更灵活蓝色线代表价格,不同时期的价格策略

2021-09-16 14:48:57 165

原创 用户画像体系(电商平台入驻商角度)

不同地区订单数长期策略:把处于二象限的往四象限移短期策略:把二象限的资源往四象限倾斜

2021-09-15 16:15:32 128

原创 电商平台订单报表分析

下单时间字段拖到行和值里

2021-08-24 16:21:34 505

原创 CPC广告分析

CPC广告

2021-08-18 16:13:11 162

原创 算法基础-HMM

模型介绍https://www.cnblogs.com/pinard/p/6945257.html前向后向算法https://www.cnblogs.com/pinard/p/6945257.html维特比算法https://www.cnblogs.com/pinard/p/6945257.html

2020-08-10 16:36:27 104

原创 算法基础-LDA

2020-08-07 09:50:31 101

原创 算法基础-贝叶斯网络

2020-07-21 16:56:14 129

原创 算法基础-EM(无监督)

N(xi|uk,Σk)表示在给定uk,Σk的情况下,第i个样本属于第k个高斯分布的概率密度,πk表示第k个高斯分布本身被选中的概率例子:假设k=2,想知道样本身高属于男还是女,先验性地给定一个男性和女性身高分布的均值u和方差δ,对于每一个样本可以根据上式算出其属于男性和女性的概率。再根据这个概率,把样本对应的值拆分为属于男性的部分,属于女性的部分(如x1=1,98,x有0.9的概率属于男性,0.1的概率属于女性,则x1属于男性的身高为1.782,属于女性的身高为0.198),根据拆分后...

2020-07-05 11:45:03 443 1

原创 算法基础-聚类

利用聚类降维的思想将样本聚类成K个簇,例如k=6,再对其进行one-hot编码这样就将原来mn的样本数据转换成了m6的形式,形成了降维当p=1时,曼哈顿距离:|x1-x2|+|y1-y2|p=2,欧氏距离p=无穷大,切比雪夫距离,|x1-x2|,|y1-y2|谁最大,谁就是距离对应的值杰卡德相似系数例如推荐系统,根据A集合购买的商品,推荐B、C2个集合的商品,如何衡量B、C集合推荐的好坏,用杰卡德相似系数向量空间余弦相似度(Cosine Similarity)余弦相似度用向量空间

2020-06-28 17:10:13 291

原创 算法基础-SVM

w*x+b = 0,w为法向量,x为参数, 若等于0,代表在超平面上,=1代表与法向量同方向,-1,逆方向线性核只有一个参数c,c越大分割面的间距越窄;高斯核有2个参数,γ越大,分割面就越偏非线性,c越大,分割面间距越窄;上式为点到线的距离,如何确定最优直线?先求各个样本点到各直线的最小距离D,使得D最大的那个直线为最优直线。简化后的目标函数是带约束条件的,约束条件的个数等于样本个数...

2020-06-08 16:32:38 280

原创 XGBOOST

缺失值处理:1、使用决策树,允许缺失值存在2、用均值、中位数等填充3、用模型预测缺失值

2020-06-04 22:50:21 123

原创 算法基础-提升

Adaboostem为误差率,误差率越小,am越大,误差率越大,am越小权值的更新是wm+1乘以 exp(*),如果分类分错了,yG(x)<0,am>0,则-amG(x)>0,所以exp(x)>1,相当于权值乘以一个大于1的数,即分类如果分错了,增加权值;同理如果分对了,exp(x)<1,权值会变小。...

2020-05-18 23:20:49 263

原创 算法基础-决策树随机森林

##决策树

2020-05-11 17:04:04 383

原创 算法基础-回归

回归

2020-05-03 21:51:03 192

原创 算法基础-最大似然估计/数据清洗

最大似然估计数据清洗和特征选择

2020-04-28 15:37:50 262

原创 ## k-means

聚类一般用在分类之前一般超过0.1就算好

2020-04-19 22:05:09 106

原创 ##逻辑回归/模型的保存与加载

模型的保存与加载逻辑回归C 正则化惩罚力度

2020-04-17 16:59:52 772

原创 ## 线性回归

如何求解系数W方式1 最小二乘法方式2 梯度下降sklearn 版本区别回归性能评估梯度下降和正规方程比较正则化思想:减少参数的权重岭回归(带正则化的线性回归)参数正则化力度α(或者λ)越来越大,高次项的系数越来越小...

2020-04-16 16:29:57 96

原创 决策树和随机森林

决策树

2020-04-01 16:39:03 96

原创 K近邻和朴素贝叶斯算法

案例 预测用户入住位置

2020-03-30 16:25:27 134

原创 ## 降维

一般使用小数形式的参数,代表保留的信息程度

2020-03-24 16:59:17 69

原创 # 机器学习概述

概述机器学习中,重复值不需要处理特征工程特征抽取

2020-03-20 21:09:02 73

原创 # 线性代数

2020-03-11 20:58:38 91

原创 # 概率论

在这里插入图片描述

2020-03-08 19:51:13 93

原创 梯度下降

关于梯度下降算法的直观理解,我们以一个人下山为例。比如刚开始的初始位置是在红色的山顶位置,那么现在的问题是该如何达到蓝色的山底呢?按照梯度下降算法的思想,它将按如下操作达到最低点:第一步,明确自己现在所处的位置第二步,找到相对于该位置而言下降最快的方向第三步, 沿着第二步找到的方向走一小步,到达一个新的位置,此时的位置肯定比原来低第四部, 回到第一步第五步,终止于最低点按照以上5步,最...

2020-03-04 22:55:42 146

原创 画股票图

画股票图import datetimeimport matplotlib.pyplot as pltfrom matplotlib import styleimport pandas as pdimport pandas_datareader.data as webif __name__ == '__main__': start = datetime.datetime(201...

2019-12-05 10:18:11 250

原创 matplotlib画图

matplotlib画图散点图## s:点大小## c:颜色## marker:点的样式## alpha:透明度x = np.random.randn(1000)y=x+np.random.randn(1000)*0.2plt.scatter(x,y,s=10,c='b',alpha=0.1)plt.show()折线图x=np.linspace(-10,10,5)y=...

2019-12-04 09:31:24 89

原创 matplotlib画图

matplotlib画图import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inlinex = np.arange(-10,11)plt.plot(x,x**2)``![在这里插入图片描述](https://img-blog.csdnimg.cn/201911282154...

2019-11-28 21:56:41 135

原创 python pandas

python pandaspandas的series和dataFramepandas和numpy的关系:numpy是列表,pandas是字典,pandas基于numpy构建。Series的形式:索引在左边,值在右边。没有为数据指定索引会自动创建0到N-1(N为长度)的整数型索引。DataFrame是一个表格型的数据结构,每列可以是不同的值类型,既有行索引也有列索引。取df的“指标1”...

2019-11-20 09:57:52 445

原创 python pandas

python pandasfrom pandas import *#import pandas as pdimport numpy as np #读取csv、xlsx文件,获得DataFrame数据结构#data = pd.read_csv('filename.csv',header=None)#data = pd.read_excel('filename.xlsx') #将...

2019-11-14 09:59:44 70

原创 python numpy

python numpyNumPy 中定义的最重要的对象是称为 ndarray 的 N 维数组类型,它是描述相同类型的元素集合。ndarray 中的每个元素都是数据类型对象(dtype)的对象。ndarray 中的每个元素在内存中使用相同大小的块。numpy.array(object, dtype=None, copy=True, order='K', subok=False, ndmin=0...

2019-11-07 16:01:02 94

原创 mysql查询语句

mysql查询语句修改表添加列:alter table 表名 add 列名 类型删除列:alter table 表名 drop column 列名修改列:alter table 表名 modify column 列名 类型; -- 类型alter table 表名 change 原列名 新列名 类型; -- 列名,类型添加主键:alter table 表名 add prim...

2019-10-28 16:37:39 58

原创 mysql基础

mysql基础1.什么是SQL?Structured Query Language:结构化查询语言其实就是定义了操作所有关系型数据库的规则。每一种数据库操作的方式存在不一样的地方,称为“方言”。2.SQL通用语法SQL 语句可以单行或多行书写,以分号结尾。可使用空格和缩进来增强语句的可读性。MySQL 数据库的 SQL 语句不区分大小写,关键字建议使用大写。3. SQL分类...

2019-10-23 14:09:18 94

原创 mysql基础

mysql基础SQL组成部分:1、DDL:数据定义语言,主要用于定义数据库、表、视图、索引和触发器等。Drop, create, alter等2、DML:主要包括对数据的增删改。insert插入数据、update更新数据、delete删除数据3、DCL:数据控制语言,主要用于控制用户的访问权限。像grant,revoke, commit, rollback等语句...

2019-10-21 16:58:04 66

原创 二叉树

二叉树二叉树的三种遍历方法:先序遍历、中序遍历、后序遍历。先序遍历即遍历顺序为“根—>左->右”。中序遍历即遍历顺序为“左—>根—>右”,由于二叉树为有序树,因此中序遍历输出的值由小到大的。后序遍历即遍历顺序为“左—>右—>根”。...

2019-10-17 14:35:04 81

原创 冒泡排序、选择排序、快速排序

冒泡排序、选择排序、快速排序冒泡排序冒泡排序的思想在于,不断地将当前元素与后一个元素进行比较,如果当前元素较小,则调换当前元素与后一个元素的位置,否则保持不变;假设需要排序的元素一共有n个,从第一个元素开始,对后续的(n-2)元素进行上述比较,最终的排序结果中,最后的元素是最大值。def bubble_sort(alist): n = len(alist) for j in ...

2019-10-14 15:48:56 135

原创 Python实现栈和队列

Python实现栈和队列PS:栈、队列的功能都可以通过顺序表、链表禁用某些操作实现class SStack(): #基于顺序表技术实现的栈类 def __init__(self): #用list对象_elems存储栈中元素 self._elems=[] #所有栈操作都映射到list操作 def is_empty(self):...

2019-10-04 16:32:04 131

原创 数据结构:单链表、双链表、单向循环链表

数据结构:单链表、双链表、单向循环链表class Node(object): """节点""" def __init__(self, elem): self.elem = elem self.next = None # 初始设置下一节点为空# 创建单链表,并实现其应有的功能class SingleLinkList(object):...

2019-09-30 10:13:26 234

原创 数据结构:顺序表

数据结构:顺序表基本形式:数据元素本身连续存储,每个元素所占的存储单元大小固定相同,元素的下标是其逻辑地址,而元素存储的物理地址(实际内存地址)可以用过存储区的起始地址加上逻辑地址与存储单元大小的乘积计算得到Loc(ei) = Loc(e0) + c*i访问指定元素时,无需从头遍历,通过计算便可获得对应地址,时间复杂度为O(1)元素外置:若元素大小不一致,则采用元素外置形式,即将数据元...

2019-09-27 13:49:22 250

原创 算法与数据结构

算法与数据结构算法的概念算法是计算机处理信息的本质,因为计算机程序本质上是一个算法来告诉计算机确切的步骤来执行一个指定的任务。一般地,当算法在处理信息时,会从输入设备或数据的存储地址读取数据,把结果写入输出设备或某个存储地址供以后再调用。算法是独立存在的一种解决问题的方法和思想。对于算法而言,实现的语言并不重要,重要的是思想。算法可以有不同的语言描述实现版本。算法的五大特性1、输入:...

2019-09-25 21:13:54 183

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除