- 博客(6)
- 收藏
- 关注
原创 Dune 数据分析教学(一):导读
PS:本系列文章仅会介绍和总结各类Dune 的查询sql写法,因为作者本人也并非专业人员,因此如有不足请大家指正。沙丘是区块链数据分析链上数据工具,可以辅助数据分析人员进行项目分析,以跟进一级项目和辅助交易。后续我会撰写系列文章,和大家一起学习Dune QL的使用。因此Dune的数据分析是非常有必要的。图一:沙丘数据分析样本。
2024-06-05 14:44:21 214
原创 机器学习笔记:特征处理——相关性分析GINI impurity
做相关性分析的方法有很多,这里分享几个相关性分析。1、GINI系数公式:(网上贴的)G=i=1∑Cp(i)∗[1−p(i)]什么是基尼系数呢,其实就是P(Y|X)的一种变形,用人话就是说,利用多个标签,是否能区分模型,也就是相关度。引入示例加深理解X Y有钱 老板有钱 傻逼没钱 老板没钱 傻逼没钱 傻逼如果他有钱的情况下,他是老板的概率为0.5,他没钱的情况下,他是老板的概率为0.33(三分之一)所以他的GINI系数为
2022-05-27 19:30:42 856
原创 机器学习笔记:特征处理常用pandas
最近在处理机器学习时,发现相较于模型训练,更多的是处理数据特征,数据合成在不增加信息量的情况下增加了信息质量,可能更适用机器学习训练。一、常用的数据处理其实都是以下两个需求的变形(实在不行手动计算)1、滑动计算data['pre'] = data['now'].shift(1)# shift(1)表示向下滑动# 得到的数据第一个为nan,后面为每行向下滑动(第一行数据滑动至第二行,以此类推)2、删除none值(numpy也有相同调用方法)data.dropna(inpla
2022-05-26 15:38:22 141
原创 机器学习笔记:归一化与反归一化的实际应用
数据归一化与反归一化是一套组合,目的是提升数据的精度和提高运算效率。归一化:一般的教程里scaler1会直接命名为scaler,会让别人误以为这是个函数,但其实他是一个变量, 可以通过更改此变量命名去归一不同维度的数据,方便反归一化# 数据的归一化data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]scaler1 = MinMaxScaler()result1 = scaler1.fit_transform(data)"""[
2022-05-19 20:08:36 1798
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人