自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 问答 (1)
  • 收藏
  • 关注

原创 [学习笔记]用户新增预测挑战赛教程

解题思路:很经典的二分类预测问题,主要是根据特征预测结果。对于模型预测性能的提升可从特征和预测算法两个方面进行。对于特征,可通过特征工程的方式优化特征、构造新的有价值的特征。对于算法,一方面选择已知的预测性能好的方法,另一方面可以通过集成学习的方式进行优化。深度学习在某种程度上可以自动学习特征,但对于特定问题,手动设计特征可能会更有效。可解决问题:分析用户使用场景以及预测用户增长情况的关键步骤,有助于进行后续产品和应用的迭代升级。赛题问题简述:根据现在的字段信息,预测某用户是否会成为新增用户。

2023-08-18 22:33:47 172 1

原创 农民身份识别挑战赛【学习笔记2】

还没学习完。。。

2023-08-09 22:27:07 151 1

原创 AI量化模型挑战赛【学习笔记2】

正则化是一种防止过拟合的技术,能够提高模型的泛化能力。则化通过向损失函数中引入惩罚项来实现,这些惩罚项会根据模型参数的大小进行调整,以减少大的参数值,从而使模型更加平滑和稳定。L1范数正则化(Lasso正则化):它向损失函数中添加参数的绝对值之和作为惩罚项。L1正则化有助于产生稀疏权重,即许多特征的权重会变为零,从而实现特征选择和降维的效果。* L2范数正则化(Ridge正则化):它向损失函数中添加参数的平方和的平方根作为惩罚项。

2023-08-09 21:42:05 184 1

原创 农民身份识别挑战赛【学习笔记】

torch是一个开源的机器学习库,它提供了丰富的工具和函数,用于构建和训练神经网络。torch提供了各种各样的张量操作函数,如加法、乘法、矩阵乘法等,以及各种常见的数学函数和激活函数。总的来说,os.listdir更适合简单地获取目录下的文件和文件夹列表,而glob.glob更适合根据模式匹配来获取符合条件的文件路径列表。返回结果:os.listdir返回一个包含目录下所有文件和文件夹名称的列表,而glob.glob返回一个符合指定模式的。

2023-08-06 18:15:20 71

原创 AI量化模型预测挑战赛【学习笔记】

cv_model 是自己定义的一个函数模型,其中没有知名使用哪种算法建模,调用时传递了 CatBoostClassifier类,在建模时通过传递后的clf构建catboost实例进行实现。

2023-08-06 11:59:11 71

原创 excel中如何对筛选后的单元格进行复制粘贴

粘贴时,右击有一“粘贴值到可见单元格”ps:前提是复制的数据也来着wps。复制时和不进行筛选时一致。用wps可以轻松实现。

2023-07-05 09:07:12 718 1

转载 多元线性回归检验t检验(P值),F检验,R方等参数的含义

多元线性回归检验t检验(P值),F检验,R方等参数的含义 - 另一个起点 - 博客园 (cnblogs.com)

2023-03-18 15:53:14 884

原创 图的基本表示_图神经网络第二节

图的基本介绍

2023-02-16 23:36:58 78

原创 图神经网络基本介绍第一节课

图神经网络的基本介绍

2023-02-15 23:00:23 56

转载 sklearn和tensorflow

sklearn是python中的一个机器学习库,封装了大量机器学习算法,同时也内置了数据集;tensorflow是一个编程系统,是一种计算图模型,即用图的形式来表示运算过程的一种模型,在Python语言中,返回的tensor是NumPy中的ndarray对象。

2023-01-08 22:18:21 912

原创 excel实现批量查找

在几千人的名字中,找D列对应人名,并将其金额数据存在E列中。可以使用VLOOKUP函数,上图操作,在E2中输入 =VLOOOKUP(D2,A:B,2,0)第一个参数是:查找目标所在单元格第二个参数是:查阅的范围第三个参数是:返回值在查找区域中的列号第四个参数是:是否模糊查找。1模糊查找 0精确查找。https://wenda.so.com/q/1533115463211480...

2022-03-09 20:37:28 5684

原创 将纯色背景的图片转换为背景透明的图片--网站

今天搜东西的时候发现了一个可以将纯色背景去除的网站,可以自动调整容差值,分析一下,以备不时之需!jBgRemover-在线图片去底工具-背景变透明|图片底色去除去掉 (aigei.com)效果:ps:当我们在提取一些素材图片的时候,可能由于图片格式等原因,使得原本背景透明的图片变成了纯色背景的图片。这时候我们可以使用BgRemover图片去底工具将“纯色背景的图片”再次还原成“透明背景的图片”。...

2022-03-05 10:09:22 692

原创 对于tk.StringVar()理解

StringVar是Tk库内部定义的字符串变量类型,在这里用于管理部件上面的字符;这个可以跟踪变量值的变化,普通的python变量不能即时地显示在屏幕上面。StringVar并不是python内建的对象, 而是属于Tkinter下的对象。在使用界面编程的时候,有些时候是需要跟踪变量的值的变化,以保证值的变更随时可以显示在界面上。由于python无法做到这一点,所以使用了tcl的相应的对象,也就是StringVar、BooleanVar、DoubleVar、IntVar所需要起到的作用...

2022-02-26 20:39:41 16689

原创 解决_tkinter.TclError: invalid command name

问题描述:当我想查询17题时,应该弹出17题的文本框,但是弹出了16题的文本框,如第二个图所示:当我关闭以上两个对话框时,第17题的文本框弹出,当我关闭17的文本框时,出现“_tkinter.TclError: invalid command name ".!entry"”错误提示。解决:在网上搜了很多资料,也没解决。然后我就去反复查看代码,发现不管想查看第几题都会先弹出16题的文本框.然后我先把第16题的代码注释掉了,发现没有错误了再之后,我开始检查16题的代.

2022-02-10 13:46:11 8409

原创 python中输出双引号,用字符串表示双引号

在python中输出“”可以用以下形式str='""'print(str)结果如下:同理,如果想要输出单引号,则可以str="'"print(str)

2022-02-10 12:35:53 6050

原创 用notepad++打开.md文件

什么是.md文件?.md文件是markdown文件的扩展名。如何打开?通过notepad++可以打卡该文件。具体步骤如下:1.下载notepad++,地址:https://notepad-plus-plus.org/downloads/2.安装成功候再安装markdown插件即可。然后点插件管理。在弹窗中搜下图这两个插件:然后点击安装即可。安装成功后,在标题栏会有这两个小标.md文件用notepad++打开后,点击任一小标即可浏览。..

2021-10-31 21:26:02 6473

原创 No module named ‘tqdm‘,与No module named ‘lightgbm‘

在运行项目时出现了以上两那个错误,说明缺少了 ‘tqdm’,'lightgbm’两个模块,只需使用管道安装即可,其他缺失也类似。具体操作如下:然后:分别执行蓝色的代码即可。

2021-10-18 19:17:04 515

原创 自适应提升法

自适应提升算法,英文Adaboost的全称是Adaptive Boosting。是一种有监督的集成学习。核心思想是对某一特定的训练集训练多个弱分类器,然后根据相应策略将这些弱分类器结合起来,构成最终的强分类器。自适应提升法的核心思想是,在每次分类任务中重点关注被错误分类的样本,减少对被分类正确的样本的关注。这样逐步可以得到一个比较清晰的分类方向,即一个强分类器。...

2021-10-14 09:14:08 940

原创 分类树节点分裂

在进行分裂决策时,要先比较每个特征信息增益的大小。特征的类别有三种情况:类别特征、数值特征以及含缺失值的特征。类别特征:ID3算法:先要给出一个阈值,然后计算每个类别的信息增益,选信息增益最大的类别作为分类节点,一直重复这个过程,直到某类别的信息增益率小于事先给定的阈值时。数值特征数值特征是要转换为类别特征的。C4.5算法:是对ID3算法的改进,改进方面包括处理数值特征、处理含缺失值的特征、使用信息增益比代替信息增益以及给出树的剪枝策略等等。在处理数值特征时,可以通过是最佳分割法

2021-10-12 18:29:33 556

原创 信息熵和信息增益

通俗理解:信息熵是描述事物的复杂程度,即一件事发生的不确定性。信息增益是指一个节点分裂后对这个事件不确定性或者纯度带来的影响。当一件事发生的可能性越低时,其不确定性越大,相应的纯度越低信息增益在分类任务中的作用表现在,通过计算信息熵,看哪个属性对分类结果的影响最大。基本表示信息熵,表示X事件发生的不确定性。条件熵,表示,在X的情况下,Y带来的不确定性信息增益...

2021-10-12 15:20:29 833

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除