自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Exist和in的区别

Existselect book_keyfrom bookwhere exists (select book_key from sales);Inselect book_keyfrom bookwhere book_key in (select book_key from sales);The EXISTS clause is much faster than IN when the subquery results is very large.

2020-09-22 01:29:37 227

原创 Leetcode - SQL 1158 -Case When使用

这里写目录标题题目思路题目Write an SQL query to find for each user, the join date and the number of orders they made as a buyer in 2019.The query result format is in the following example:Users table:±--------±-----------±---------------+| user_id | join_date |

2020-09-22 00:45:44 160

原创 LeetCode - SQL 603 - 取该列连续的三位数(LEAD和 LAG的使用)

这里写目录标题题目思路思路2题目Several friends at a cinema ticket office would like to reserve consecutive available seats.Can you help to query all the consecutive available seats order by the seat_id using the following cinema table?seat_idfree1120

2020-09-20 04:49:21 323

原创 LeetCode - SQL 597 -两个group bys 代替 distinct

目录题目:思路:题目:In social network like Facebook or Twitter, people send friend requests and accept others’ requests as well. Now given two tables as below:Table: friend_requestsender_idsend_to_idrequest_date122016_06-01132016_06-01142

2020-09-19 05:13:06 123

原创 分类算法评价指标 准确率、精确率、召回率、F-score、ROC、PR曲线

分类是将数据根据一定的规律进行分类,进入模型能够对未来数据进行预测。应用场景包括:判断邮件是否是垃圾邮件判断是否发放贷款判断是否为不良用户常见的分类算法包括:朴素贝叶斯支持向量机逻辑回归决策树KNN临近算法目录评价指标值指标准确率 Accuracy精确率 Precision召回率 RecallF-Score图指标Precision-Recall PR曲线ROC曲线评价指标值指标准确率 Accuracy正确分类的样本数与总样本数之比(预测对的总样本 / 总总样本数)

2020-08-29 05:24:36 2538

原创 方差分析ANOVA、T检验、卡方检验的区别

T检验和ANOVA都是用来看样本之间均值是否相等,但是两者又有什么区别呢?卡方检验是用来看分类变量之间有没有相关性。自变量X类型自变量X组数因变量Y类型分析方法离散(类别)仅仅2组连续(均值)t检验离散(类别)2组及以上连续(均值)ANOVA离散(类别)2组及以上离散(类别)卡方检验进一步细分方差分析从理论上讲,方差分析有两个前提条件,一是因变量Y需要满足正态性要求,二是满足方差齐检验。方差不齐时可使用‘非参数检验’,同时还可使用wel

2020-08-25 06:06:16 36274

原创 假设检验、显著性水平α、P值、置信区间

什么是假设检验?统计学有两个推断统计方法,一个是参数估计,另一个是假设检验。参数估计用样本统计量来推断总体参数的方法假设检验是基于某一假设的前提下,同样利用样本统计量去检验这个假设是否成立。假设检验的方法论(1)提出原假设;假设分为原假设H0和备选假设H1H0一般是我们想要拒绝的假设一般是=、>=、<=H1是我们想要接受的假设一般是<> 、 >、<(2)选择假设检验方法,计算检验统计量;(3)判断临界值,得出结论;(根据检验统计量或P值)

2020-08-22 06:59:06 37528 1

原创 如何评价回归算法的优劣 MSE、RMSE、MAE、R-Squared

如何评价回归算法的优劣 MSE、RMSE、MAE、R-Squared前言均方误差 MSE(Mean Squared Error)代码实现均方根误差(RMSE)代码实现平均绝对误差 (MAE)R Squared代码实现通过scikit-learn来计算metricsNoticeMAE vs RMSE前言回归算法同分类算法不同,回归算法主要用来预测,而分类算法的目的是为了分类,所以两种算法的评判标准当然也不一样。本文就是从MSE、RMSE、MAE、R-Squared四个指标来谈一谈如何衡量回归算法的好坏。

2020-08-20 01:34:17 32038

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除