nono19nice
码龄9年
关注
提问 私信
  • 博客:175,120
    社区:194
    175,314
    总访问量
  • 23
    原创
  • 2,108,566
    排名
  • 62
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2015-08-03
博客简介:

nono的博客

博客描述:
希望分享的内容能够帮助大家解决问题~
查看详细资料
个人成就
  • 获得83次点赞
  • 内容获得28次评论
  • 获得436次收藏
创作历程
  • 5篇
    2022年
  • 2篇
    2021年
  • 5篇
    2020年
  • 5篇
    2019年
  • 6篇
    2018年
成就勋章
TA的专栏
  • 数据仓库
    8篇
  • 数据分析挖掘
    15篇
  • 电脑相关设置
    1篇
  • 数据查询
    4篇
兴趣领域 设置
  • 大数据
    hive
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

179人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

置信度和置信区间

置信度:这个数值存在于我们计算出的这个范围的可信程度,如果置信度是95%,则表示95%的概率真正的数值会在我们所计算的范围内。置信区间:根据95%的置信度计算出数值所在的区间。计算过程:①确定置信度=1-显著性水平,一般显著性水平选0.05,所以置信度为95%②根据①得到区间外的概率一共为5%,由于正态分布对称,所以分别为p=2.5%③根据②的概率去标准正态分布表格里查找 对应的标准分z值,得到为-1.96,由于左右对称,所以-1.96 和 1.96④计算区间:[A,B]A =
原创
发布博客 2022.03.31 ·
12171 阅读 ·
4 点赞 ·
0 评论 ·
27 收藏

【辛普森悖论】分析一下有没有可能出现“两个投放方案的转化率都在上升,但两者的综合转化率却对比下降”的可能?

数据分析中常遇见的辛普森悖论举例:分析一下有没有可能出现“两个投放方案的转化率都在上升,但两者的综合转化率却对比下降”的可能?答:有,存在基数即分母问题。转化率有较大差异 和 低点击率群体占比增大比如原先A方案 20人,转化1人,B方案100人,转化99人,总转化率 100/120现在A方案100人,转化6人,B方案20人,转化20人,总转化率 26/120。其他举例:男生点击率增加,女生点击率增加,总体为何减少因为男女的点击率可能有较大差异,同时低点击率群体的占比增大。如原
原创
发布博客 2022.03.31 ·
1054 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

经常说的ROI是什么,怎么计算

衡量广告效果的一个最重要的指标,投资回报率(Return On Investment),即一定周期内,广告主通过广告投放收回的价值占广告投入的百分比。投资回报率(ROI)=产出(销售收入)/ 投入(成本)举例:如某电商在5月份投放了100万的广告费用,获取了价值200万的有效订单金额(利润50w),则ROI为200/100=2。当然也可以定义为是利润/成本 = 50/100。...
原创
发布博客 2022.03.31 ·
29825 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

HIVE基础创建表和导入、删除语句

一、创建表create table if not exists tmp(date_stat_date datetime comment '统计日期_日期格式',platform string comment '端口',expose_uv bigint comment '曝光uv',avg_e
原创
发布博客 2022.03.29 ·
2637 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

HIVE 行转列、列转行sql

一、hive 多列转多行-----hive 多列转多行SELECT distinct ds ,channel ,rank , name FROM ( SELECT ds ,channel ,MAP( '1' ,prev_n
原创
发布博客 2022.03.29 ·
2289 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

HIVE udf、udaf、udtf函数定义与用法(最全!!!!!)

一、定义1、hive udf、udaf、udtf函数定义与用法(1)UDF(user-defined function)作用于单个数据行,产生一个数据行作为输出。(数学函数,字符串函数)(2)UDAF(用户定义聚集函数 User- Defined Aggregation Funcation):接收多个输入数据行,并产生一个输出数据行。(count,max)(3)UDTF(表格生成函数 User-Defined Table Functions):接收一行输入,输出(explode)总结:
原创
发布博客 2021.02.08 ·
5481 阅读 ·
4 点赞 ·
0 评论 ·
28 收藏

HIVE 计算连续n天登陆的用户

----用户连续n天登陆天数SELECT device_id ,diff_date --根据连续登陆的起始日期计算连续登陆天数 ,COUNT(ds)FROM ( SELECT device_id ,ds ,ROW_NUMBER() OVER (PARTITION BY device_id ORDER BY ds ) rnk ---计算当前日期 在 统计时间.
原创
发布博客 2021.02.08 ·
908 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

客户价值分析和精准营销

整理中...参考链接:(1)https://blog.csdn.net/wanglingli95/article/details/79444432
原创
发布博客 2020.04.14 ·
437 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

用户生命周期如何判断

整理中....
原创
发布博客 2020.04.14 ·
868 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ks曲线、混淆矩阵、ROC曲线、AUC面积等指标定义和关系

原创
发布博客 2020.04.13 ·
665 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

常见的风险欺诈方式(仅供参考,未完待续)

整理中...
原创
发布博客 2020.04.13 ·
525 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

流失用户分析相关研究专题(包括如何定义和召回)

整理中...
原创
发布博客 2020.04.13 ·
433 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

spark-sql跑数据Failed with exception java.io.IOException:org.apache.parquet.io.ParquetDecodingExceptio

错误信息:Failed with exception java.io.IOException:org.apache.parquet.io.ParquetDecodingException: Can not read value at 0 in block -1 in file oss:/xxxxxxxxxx.snappy.parquet修改方式:在运行spark-sql前 添加这样...
原创
发布博客 2019.03.15 ·
1295 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Mac 解压rar 文件

Mac 解压rar 文件第一种方法:下载下面链接中的软件,安装好就可以直接用了。http://baijiahao.baidu.com/s?id=1604390455412644388&wfr=spider&for=pc安装过程中,一直点击下一步即可第二种方法:https://blog.csdn.net/weixin_41935140/article/d...
原创
发布博客 2019.03.02 ·
3067 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

特征处理过程 中的 独热编码(onehot)与哑变量及python 代码实现

为什么要用onehot:二. 为什么使用one-hot编码来处理离散型特征?1.使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点。2.将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余...
原创
发布博客 2019.03.02 ·
5069 阅读 ·
4 点赞 ·
2 评论 ·
23 收藏

机器学习特征工程--标准化和归一化

关于归一化和标准化1.标准化使用条件(1)不需要对特征进行归一化:基于树模型的方法举例: 随机森林/bagging/boosting/xgboost需要标准化的(基于距离的模型):回归分析(逻辑回归)/神经网络 / svm2.相关定义什么叫归一化(标准化):归一化化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。为什么要归一化(标准化):...
原创
发布博客 2019.03.02 ·
4424 阅读 ·
1 点赞 ·
0 评论 ·
19 收藏

Kmeans聚类原理及python实现代码

kmeans 原理:(1)首先,随机确定k个初始点的质心;(2)然后将数据集中的每一个点分配到一个簇中,即为每一个点找到距其最近的质心,并将其分配给该质心所对应的簇;(3)对每一个簇,计算簇中所有点的均值并将均值作为质心(例:在三维空间里,计算各个点的x的均值得到x1,y的均值得到y1,z的均值得到z1,以此得到新的坐标点 x1,y1,z1,然后重新计算各个点距离最近的族)(4)重...
原创
发布博客 2019.03.02 ·
3000 阅读 ·
1 点赞 ·
0 评论 ·
24 收藏

Mac Kettle安装教程

第一步:先安装jdkhttp://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html下载mac版的,下载好后,直接安装,直到最后一步就可以了打开终端,输入 java -version,查看是否安装成功,如图为安装成功的图第二步:下载kettlehttps://community.hds.com/d...
原创
发布博客 2018.04.23 ·
10291 阅读 ·
3 点赞 ·
11 评论 ·
16 收藏

MAC 安装mysql 连接驱动ODBC时安装错误

应用场景:使用tableau连接时mysql时,提示需要安装驱动,如下图然后需要安装连接驱动,odbc下载地址:https://dev.mysql.com/downloads/connector/odbc/原因:未安装odbc管理器下载地址:http://www.odbcmanager.net/ 下载好后,直接安装,显示安装成功,不用像教程那样改配置,然后再去安装mysql 5.3.10 显示成功...
原创
发布博客 2018.04.23 ·
5676 阅读 ·
10 点赞 ·
0 评论 ·
4 收藏

ks(洛伦兹曲线)指标理解

KS(Kolmogorov-Smirnov)值越大,表示模型能够将正、负客户区分开的程度越大。KS值的取值范围是[0,1]通常来讲,KS>0.2即表示模型有较好的预测准确性。ks求解方法:ks需要TPR和FPR两个值:真正类率(true positive rate ,TPR), 计算公式为TPR=TP/ (TP+FN),刻画的是分类器所识别出的 正实例占所有正实例的比例...
原创
发布博客 2018.04.20 ·
49293 阅读 ·
6 点赞 ·
7 评论 ·
83 收藏
加载更多