自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 逻辑回归LR

将线性组合转化为概率:逻辑回归模型通过将输入特征的线性组合()传递给Sigmoid函数,将其转化为一个介于0和1之间的概率值。Ⅱ:平滑性:Sigmoid函数是光滑的S型曲线,具有连续导数。这使得逻辑回归模型易于优化,可以使用梯度下降等优化算法来找到最佳参数。

2023-11-26 14:36:06 862 1

原创 正则化、过拟合、极大似然函数、梯度下降、损失函数、极大似然估计

今天来总结一下机器学习中的一些零零散散的知识。坐标:北京天气:晴 伴有微风。

2023-09-14 19:55:01 228 1

原创 ML2_Kmeans聚类

聚类方法已经被广泛运用在如图像处理、客户精准营销、生物信息学等多个领域,也可以作为使用分类方法前对数据进行预先探索的一种手段来使用。其中,X为数据对象;Ci为第i个聚类中心;m为数据对象的维度;Xj,Cij为X和Ci的第j个属性值。直到聚类中心不再变化或达到最大的迭代次数时停止。

2023-08-14 10:29:05 52

原创 ML1_监督学习&无监督学习

监督学习适用于有已知输出的问题,无监督学习适用于需要发现数据内在结构的问题。具体选择哪种学习方法取决于问题的性质和可用的数据。监督学习是通过使用带有标签的训练数据去训练模型,每个输入样本都有相应的输入特征和对应的预期输出(标签)无监督学习是通过使用不带标签的训练数据去训练模型,其中训练样本只包含输入特征,没有对应的输出标签。监督学习的目标是通过模型学习输入与输出之间的映射关系,从而能够对未标记的输入进行预测。无监督学习的目标是发现数据中的模式、结构和关系,对数据进行聚类、降维、异常检测等任务。

2023-08-14 09:16:35 36

原创 ABtest与假设检验(一)

假设检验是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立由定义可知,我们需要对结果进行假设,然后拿样本数据去验证这个假设。所以做假设检验时会设置两个假设:一种叫原假设,也叫零假设,用H0表示。原假设一般是统计者想要推翻的假设。原假设的设置一般为:等于=、大于等于>=、小于等于<=。另外一种叫备择假设,用H1表示。备则假设是统计者想要接受的假设。备择假设的设置一般为:不等于、大于>、小于<。例子在进行假设检验时,我们希望接受版本2的假设,想拒绝接受版本1的假设。

2023-08-13 17:13:32 59 1

原创 SQL基础

有三种SQL表关联方式:内连接、外连接和交叉连接。内连接仅返回两个表中匹配的行,而外连接返回两个表中所有的行以及匹配的行。交叉连接不需要任何条件,它返回两个表中所有可能的组合。(从第0条记录开始,往后偏移20条记录 | 或者理解为每页20条记录)(列的旧名字和新名字之间可以用空格,也可以用AS,也可以用双引号)如果查询语句中出现了多个表中都存在的字段,则必须指明此字段所在的表。

2023-08-04 19:20:53 18 1

原创 二、ABtest

以一些废话来引入:还是得工作中锻炼自己的能力,比如说产品做到最后,你需要优化细节,比如按钮配色,字体字号,书上说小四字号是最好的,那就一定吗?就比如下面这三个页面哪个好?你也不知道,有的用户喜欢大字体,有的喜欢小字体(切记主观臆断),这时候就需要把这个工作交给AB测试。

2023-08-03 10:30:42 67

原创 一、漏斗模型

然后漏斗的大致形状就显示出来了(橙色部分),接着删掉辅助列;以B3单元格为例:(=($C$2-C3)/2)点击插入->二维条形图->堆积条形图。点击设置坐标轴格式,点击逆序类别。鼠标右击橙色部分然后添加数据标签。自己补充了一列:辅助列;

2023-08-02 21:49:11 131

原创 C++滑动窗口例题

写完本题之后,sum其实不需要更新多次,比如i++之后,按我之前的想法还需要重新算一遍sum,但是完全可以用sum -= nums[i]来代替,这样就不需要重新计算sum。归根结底,这样遍历完整个数组,当时我对滑动窗口的“滑动”二字理解并不深刻,仅仅以为“滑动”不过是两个指针控制一个窗口的初末位置。每个元素只有出窗口和入窗口的时候用到了,所以时间复杂度是O(2n)=O(n)。当时想的就是想办法循环上面的两行代码,并把sum想办法更新就完事了(sum是窗口中数字的和,即。相当于只完完全全的计算了一遍sum,

2023-07-29 22:07:39 92

原创 码题集记录

最初,我用了下面这种方法,让ch[k] == " ",但是报错显示操作数类型不兼容。①一串字符串,比如“Weeeendy is a great girl”,写程序的时候,怎么避免第一个e的结果输出之后,后面的e不会再去输出结果。题目的意思就是,让我能够用指针去指向数组,然后for循环中也去使用*(p+i)去表示。【或者说用*(p+i)代替 a[i] 】①怎么不使用strlen( )而把这一道题写出来?就是这种,我又搞了一个字符数组char ppp,数组只存放了一个空格。解决方法:让后面的e全部变为空格。

2023-07-17 22:36:23 62 1

原创 编程练习题——栈(新手)

(仅仅用来记录自己刷题的经验)

2023-07-12 15:50:56 55 1

原创 数据分析练手项目(一)

将 gp_by_hour = data.groupby["solo_hour"].sum()["num_counts"] 改为 gp_by_hour = data.groupby("solo_hour").sum()["num_counts"]即可,单独抽出place_order_time中的solo_hour,之后加一列全为1的数据,之后groupby("solo_hour")并求和sum(),绘制出即可。,比如(餐厅哪个菜卖的好,哪个菜贵,餐厅每道菜平均价格,每道菜的销量等等)

2023-07-05 23:36:41 96 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除