- 博客(8)
- 收藏
- 关注
原创 逻辑回归知识点简单总结v1
逻辑回归知识点基础知识广义线性模型sigmoid函数,求导f(x)=11+e−zf(x) = \frac {1} {1 + e^{-z}}f(x)=1+e−z1f(x)′=f(x)∗(1−f(x))f(x)^{'} = f(x) * (1 - f(x))f(x)′=f(x)∗(1−f(x))利用线性回归的预测值去逼近真实类别的对数几率利用极大似然使得每个样本属于其真实类别的概率最大化损失函数和梯度下降J(θ)=−1m∗∑[yi∗ln(hθ(xi))+(1−yi)ln(1−hθ(xi
2021-08-01 19:49:35 103
原创 SQL经典题目总结
1、求用户连续登录最大天数step1 构造伪列,对每个用户的日期排序得到字段rn(假设每个用户每日只有一条记录),再用当前日期减去rn得到新的date_tmp,若客户连续登录,那么将有若干个相同的date_tmp;step2 基于上一步结果,统计每个用户每种date_tmp下的数量,然后在对客户id groupby 计算每个客户的最大连续登录天数--step1 构造伪列,对每个用户的日期排序得到字段rn(假设每个用户每日只有一条记录),再用当前日期减去rn得到新的date_tmp,若客户连续登录,那
2021-04-13 23:42:32 179
原创 手写LogisticRegression
import numpy as npfrom sklearn import datasetsclass LogisticGression: def __init__(self): self._theta = None def sigmoid(self, t): return 1 / (1 + np.exp(-t)) def fit(self, X_train, y_train, eta=0.01, n_iters=100000):
2021-04-10 19:27:30 186 1
原创 Spark学习——利用Mleap部署spark pipeline模型
Spark学习——利用Mleap部署spark pipeline模型1.需要的依赖2.代码2.1 数据预处理、模型训练、存储2.2 预测(单条测试、批量测试)1.需要的依赖 <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-mllib_2.11</artifactId> <
2021-03-18 17:01:17 596
原创 使用Spark读写外部存储介质(Mysql、Hbase、Redis)
使用Spark读写外部存储介质(Mysql、Hbase、Redis)1、使用Spark与Mysql交互1.1 需要加载的依赖1.2 需要设置的配置项1.3 代码1、使用Spark与Mysql交互1.1 需要加载的依赖druid提供数据库连接池创建、维护和监控的功能。 <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-jav
2021-03-15 14:34:28 280 1
原创 推荐系统初学
推荐系统特征 首先需要明确的就是推荐系统的目标:用户满意性:首当其冲的,推荐系统主要是为了满足用户的需求,因此准确率是评判一个推荐系统好坏的关键指标。多样性:虽然推荐系统主要是满足用户的兴趣,但也要兼容多样性。新颖性:用户看到的内容是那些他们之前没有听说过的物品。简单的做法就是去掉用户之前有过行为的那些内容。实时性:推荐系统主要根据用户的上下文来实时更新推荐内容,用户的兴趣也是随着时...
2018-09-14 22:06:58 204
原创 剑指offer编程题,一周刷完
输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有的奇数位于数组的前半部分,所有的偶数位于数组的后半部分,并保证奇数和奇数,偶数和偶数之间的相对位置不变。解题思路:从头到尾遍历一次,如果碰到偶数,则从该偶数位置往后查找,查找到第一个奇数,将该奇数值记录下来,pop掉之后,再将该奇数插入到偶数之前的位置;class Solution: def reOrderAr...
2018-09-13 22:39:44 331
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人