leewe7
码龄12年
关注
提问 私信
  • 博客:42,263
    42,263
    总访问量
  • 39
    原创
  • 2,203,790
    排名
  • 2
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2012-10-17
博客简介:

leewe7的博客

查看详细资料
个人成就
  • 获得8次点赞
  • 内容获得3次评论
  • 获得40次收藏
创作历程
  • 4篇
    2023年
  • 12篇
    2022年
  • 7篇
    2021年
  • 16篇
    2020年
成就勋章
TA的专栏
  • 数据分析
    9篇
  • python
    12篇
  • flink
    2篇
  • 推荐系统
    3篇
  • pytroch
    3篇
  • SQL
    8篇
  • MQ
    2篇
  • 创新文章
  • 异常处理
    1篇
  • spark
    1篇
  • elasticsearch
    1篇
  • java
    3篇
  • kylin
兴趣领域 设置
  • 人工智能
    机器学习深度学习神经网络自然语言处理nlp
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

CART回归树

2、针对集合S,遍历每一个feature的每一个value,用该value将原数据集S分裂成2个集合:左集合S_left(<=value的样本)、右集合S_right(>value的样本),每一个集合也叫做一个结点。3、找到最佳分割feature以及最佳分割value之后,用该value将集合S分裂成2个集合:左集合S_left、右集合S_right,每一个集合也叫做一个结点。(ps:这个mean就是该结点的值,也就是落在该结点内的样本的预测值,同一个结点中的样本具有同一个预测值。
原创
发布博客 2023.12.01 ·
127 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

CART分类树原理

在计算出来的各个特征的各个值的基尼系数中,选择基尼系数最小的特征A及其对应的取值a作为最优特征和最优切分点。然后根据最优特征和最优切分点,将本节点的数据集划分成两部分 和 ,同时生成当前节点的两个子节点,左节点的数据集和右节点的数据集。m个样本的连续特征A有m个值,从小到大排列 ,则CART取相邻两样本值的平均数做划分点,一共有m-1个;CART分类树算法使用基尼系数选择特征,基尼系数代表了模型的不纯度,基尼系数越小,不纯度越低,特征越好。输入:训练集D,基尼系数的阈值,切分的最少样本个数阈值。
原创
发布博客 2023.12.01 ·
118 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

numpy中的lstsq(最小二乘法)函数

Numpy中的最小二乘法
原创
发布博客 2023.03.07 ·
1014 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

numpy矩阵的常见操作

numpy矩阵的常用操作
原创
发布博客 2023.03.01 ·
245 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

模型验证处理

模型验证过程
原创
发布博客 2022.12.30 ·
157 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink的UDF函数

udtf函数
原创
发布博客 2022.12.29 ·
208 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

热门服务号计算

热门服务号计算逻辑
原创
发布博客 2022.12.16 ·
75 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

用户资讯推荐

用户资讯相关推荐
原创
发布博客 2022.12.14 ·
76 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

item相似度

物品相似度
原创
发布博客 2022.12.13 ·
94 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Pytorch自定义数据集

pytorch的Dataset与DataLoader
原创
发布博客 2022.11.10 ·
543 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

SQL case when 的用法

SQL case when 运用的场景
原创
发布博客 2022.11.10 ·
884 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

pytroch的nn.Linear

pytroch的linear
原创
发布博客 2022.06.15 ·
132 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

pythroch函数介绍

函数介绍
原创
发布博客 2022.06.15 ·
225 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

RocketMQ发送消息的三种方式

1.rocketQM有三种发送方式:同步发送:等待返回结果异步发送:立即返回,使用回调函数一次性发送:只发送一次,不关心发送结果2.DefaultMQProducer同步发送DefaultMQProducer.send(msg);public SendResult send(msg,CommunicationMode.SYNC,(SendCallback)null,timeout);2.DefaultMQProducer异步发送DefaultMQProudcer.send(msg,send
原创
发布博客 2022.05.27 ·
2331 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

rocketMQ producer的异步发送

1.异步发送的回调函数producer.send(msg,new SendCallback(){ @Override public void onSuccess(SendResult sendResult){ } @Override public void onException(Throwable e){ }});2.消息发送成功 sendMessageAsyncsendResult = MQClientAPIImpl.this.processSendResponse(b
原创
发布博客 2022.05.27 ·
636 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

HIVE SQL 按照某字段先分区,分区内部排序,再取内部的第一条数据

with tmp as (select *,ROW_NUMBER() OVER (PARTITION BY name ORDER BY level1,level2) as num from table )select * from tmp where num=1
原创
发布博客 2022.02.24 ·
1328 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

python partial函数

partial的**kwargs应用场景:def a(x,**kwargs): print(x) print(kwargs.get("a"))from functools import partialdef hi(x,**kwargs): aa = partial(a,**kwargs) aa(x)调用hi("7",a="ok")
原创
发布博客 2021.12.28 ·
250 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

如何在SQL中将某个算出来的值平摊到每一行中使用

构造一个关联字段,使用left join,例如求出总和,再求占比:with a as (select name,count(1) as c,1 as j from t1 group by name),b as (select count(1) as c,1 as j from t1)select a.name,a.c as cn,b.c as total,(100*a.c/b.c) from a left join b on a.j=b.j...
原创
发布博客 2021.07.12 ·
741 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

java调用PMML模型文件

生成模型from sklearn2pmml import PMMLPipelinefrom sklearn.datasets import load_irisfrom sklearn import treeiris = load_iris()clf = tree.DecisionTreeClassifier()pipeline = PMMLPipeline([("classifier", clf)])pipeline.fit(iris.data, iris.target)print(ir
原创
发布博客 2021.06.09 ·
2070 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

IDEA控制台乱码问题

IDEA文本为UTF-8编码格式,中文不乱码,但控制台乱码,解决方式:HELP->Edit Custom VM OPtions中加 -Dfile.encoding=utf-8重启idea
原创
发布博客 2021.05.21 ·
108 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多