- 博客(11)
- 收藏
- 关注
原创 sql小笔记
substring_index(str,分隔符,序号):根据。注意:这个截取出来的是连续的,如果需要单独截取一个需要嵌套。这两个用法几乎一样,具体的不必在意,选一个就可以了。选择分割出的前几个字符串。
2024-01-12 14:06:27 416 1
原创 数据分析之缺失值和异常值的处理
需要注意的是,将该异常值作为缺失值处理,需要根据该异常值(缺失值)的特点来进行,针对该异常值(缺失值)是完全随机缺失、随机缺失还是非随机缺失的不同情况进行不同处理。这其实是一种比较折中的方法,大部分的参数方法是针对均值来建模的,用平均值来修正,优点是能克服了丢失样本的缺陷,缺点是丢失了样本“特色”可以使用不同的填充方法来替代缺失值。:若变量是离散型,且不同值较少,可转换成哑变量,例如性别SEX变量,存在male,fameal,NA三个不同的值,可将该列转换成 IS_SEX_MALE, IS_SEX_
2023-11-05 14:14:18 472 1
原创 多分类下的评价指标:准确率,精确率,召回率,F1,ROC,AUC
在实际的数据集中经常会出现类不平衡(class imbalance)现象,即负样本比正样本多很多(或者相反),而且测试数据中的正负样本的分布也可能随着时间变化。当False Positive (FP)的成本代价很高 (后果很严重)时,即期望尽量避免产生FP时,应该着重考虑提高Precision指标。ROC 曲线越陡越好,所以理想值就是 1,一个正方形,而最差的随机判断都有 0.5,所以一般 AUC 的值是介于 0.5 到 1 之间的。为了更好的表征学习器在精确率和召回率的性能度量,引入 F1 值。
2023-11-01 19:44:29 3395
原创 Linux screen 后台运行程序
然后就可以运行程序,Ctrl+A+D即可退出,变成后台运行。退出:直接exit或者Ctrl d。直接 kill 进程号即可关闭。
2023-05-05 12:30:11 478
原创 看深度学习代码遇见的一些torch用法
torch.arange(batch_size).view(-1, 1).to(device), # arrange返回大小为(end-start)/step的一维张量。torch.eq 对两个张量Tensor进行逐元素的比较,若相同位置的两个元素相同,则返回True;torch.ones_like(mask), # 返回一个填充了标量值1的张量,其大小与mask相同。torch.ones_like(mask) 返回一个填充了标量值1的张量,其大小与mask相同。torch.div 数组的点除运算。
2022-11-24 20:38:36 471
原创 pytorch安装
具体做法,在anaconda安装目录中寻找除路径“D:\Anaconda\envs\pytorch\Library\bin\pythoncom36.dll”之外的另一个“pythoncom36.dll”文件,将其替换出问题的“pythoncom36.dll”文件后就能解决无法定位程序输入点的问题。我的另一个“pythoncom36.dll”文件在目录”D:\Anaconda\Library\bin“中。进入pytorch环境 conda activate pytorch。
2022-10-03 14:06:39 2179
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人