初学笔记
文章平均质量分 62
学习笔记
高山莫衣
律己如高山般崇高品德,无需华丽衣服装饰。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
从300个点中选择使得方差最小的200个点
最小化选出的200个点的。原创 2025-06-09 11:19:46 · 876 阅读 · 0 评论 -
L2正则项
正则化项在损失函数中增加了一个惩罚项,促使优化过程在寻找最优解时,不仅考虑拟合训练数据,还要尽量选择较小的参数值,从而平衡模型的拟合能力和复杂度。通过控制参数的范数,特别是使用L2范数进行正则化,可以减小参数之间的相互影响,使得模型的学习更加独立和稳定。平衡预测准确性和模型复杂度:通过调整超参数,可以控制正则项在总体损失中的权重,从而平衡模型在训练过程中对于预测准确性和复杂度的重视程度。范数乘以一个超参数作为正则项,可以有效地控制模型的复杂度,降低过拟合的风险,并平衡模型在预测准确性和复杂度之间的权衡。原创 2023-06-23 20:35:55 · 521 阅读 · 0 评论 -
StratifiedKFold交叉验证(k-fold cross-validation)
训练和测试:在每个折叠中,使用训练索引和测试索引从原始数据集中获取相应的训练集和测试集。然后,可以使用这些数据进行模型的训练和测试。在每个折叠中,我们创建了一个逻辑回归模型,并使用训练数据进行训练。通过使用交叉验证,可以在保持数据分布一致的同时,对模型进行多次评估和验证,提高模型评估的可靠性和泛化能力。方法返回一个生成器对象,该对象提供了每个折叠的训练索引和测试索引。循环遍历生成器对象,每次迭代获取一个折叠的训练索引和测试索引。个子集,每个子集都会被用作一次测试集,其余的作为训练集。原创 2023-06-23 19:44:46 · 1086 阅读 · 0 评论 -
def __len__(self)和def __getitem__(self, idx)
这个方法用于定义对象的索引操作,即通过索引值获取对象中的元素。当你使用索引操作符[]来获取对象的元素时,实际上是调用了对象的。对象,并使用len()函数获取数据集的长度,以及使用索引操作符[]来获取数据集中的元素。注意:在实际使用中,通常会结合其他功能来实现更丰富的数据集操作,比如在。这个方法用于定义对象的长度,即返回对象中元素的数量。这个方法通常用于自定义数据集类中,用于按索引获取数据集中的样本。这个方法通常用于自定义数据集类中,用于返回数据集中样本的数量。来获取对象的长度时,实际上是调用了对象的。原创 2023-06-22 18:00:37 · 3098 阅读 · 1 评论 -
tmp[“Neither“] = ~(original_df[“A-coref“] | original_df[“B-coref“])
的二维布尔数组,其中每一行对应一个样本,每一列对应一个目标类别。两列的值,创建一个新的布尔类型的目标变量数组。方法用于创建副本,确保不会修改原始数据。根据这些值,目标变量数组。将数组的数据类型转换为布尔类型,确保。这段代码的作用是根据原始数据集中的。数组,并将其赋值给类的成员变量。在这个示例中,原始数据集有两列。该行代码创建了一个名为。表示选择这两列数据,原创 2023-06-22 17:51:53 · 163 阅读 · 0 评论 -
G.edata.update(...)
方法用于更新图中的边特征。可以使用字典来直接指定新的特征值,或者使用函数来根据边的属性计算新的特征值。) 是 DGL 图对象中的一个方法,用于更新图中边的特征数据。这将使用字典中的 new_weights 值来更新图 G 中边特征名为 ‘weight’ 的特征。如果传递一个字典作为参数,那么字典的键对应于边的特征名称,而值是用于更新边特征的新值。如果传递一个函数作为参数,该函数将接受一个 Edges 对象,并返回一个新的特征值。这将根据函数 update_fn 返回的新值更新图 G 中的边特征。原创 2023-06-20 23:58:04 · 385 阅读 · 1 评论 -
详解nodes = collections.OrderedDict()和应用案例
缓存淘汰策略:在实现缓存淘汰策略时,可以使用有序字典来记录缓存中的元素顺序,按照最近最少使用(LRU)等策略进行元素淘汰。有序字典在某些场景下非常有用,特别是需要按照元素插入的顺序进行操作或迭代的情况。历史记录管理:在需要保存用户历史记录的应用中,可以使用有序字典记录用户操作的顺序,以便回放和管理历史记录。配置文件解析:当解析配置文件时,可以使用有序字典保存配置项的顺序,以保证在读取和写入配置时的一致性。模块提供的一种字典类型,它会记住字典中元素的插入顺序,因此可以按照插入顺序遍历字典。原创 2023-06-20 21:07:55 · 297 阅读 · 0 评论 -
详解图模型中 g.update_all()、dgl.unbatch(g) 函数以及参数
message_func 函数定义了如何在每条边上发送消息,fn.sum 函数定义了如何聚合接收到的消息,而 apply_func 函数定义了如何将聚合后的消息应用到节点状态上进行更新。在每一轮更新中,它会遍历图中的所有边,调用 message_func 生成消息,然后将消息聚合到目标节点上,最后使用 apply_func 更新节点的状态。是的,在上述解释中,g 指的是包含节点和边的图对象。因此,总结起来,g 指的是包含节点和边的图对象,它用于在给定的上下文中执行图操作和计算。原创 2023-06-20 17:15:16 · 1100 阅读 · 0 评论 -
23暑假拓展学习内容
他们可以将应用程序和所有依赖项打包到一个容器中,并在任何支持 Docker 的环境中部署。这消除了“在我的机器上可以工作”的问题,因为容器在不同环境中运行的方式是一致的。此外,Docker 还提供了一些功能,如容器编排、服务发现和负载均衡,以帮助简化应用程序的部署和管理。Hadoop 的主要功能是提供分布式存储和计算能力,以处理大规模数据集,并具备容错性、可靠性和可扩展性。了解Linux:基础指令→高级指令→命令模式→拓展。算法实现:基础 → 算法。目标:秋招offer。原创 2023-06-16 09:41:05 · 164 阅读 · 0 评论 -
我的第一台电脑和编程的故事
我做过的第一个机器学习课题内容是“基于朴素贝叶斯的留言分类系统” 依稀记得笔记本跑了23分钟,才运行结束,在毕业设计时,选择了与机器学习相关的课题,并顺利拿到答辩组一甲。此后,心智开化,一发不可收拾的期待开阔机器学习的天地,此时电脑的性能已经满足不了学习需求。同时,在学院的实验室里,我有机会接触各种类型的电脑硬件,我也发现自己对于计算机硬件和软件比较感兴趣,于是开始逐渐深入探索。如今来看,虽然电脑配置有限,但我却尽可能的用它满足我的需求,我用它学会了编程、学会了视频剪辑,以及看到了网络上形形色色的故事。原创 2023-03-30 10:41:09 · 288 阅读 · 0 评论 -
BeautifulSoup库/bs4 基础&深入 技术干货
BeautifulSoup库的安装pip install bs4对HTML的装载,prettify()即表示整理,能清晰的显示文档结构(文档数) soup = BeautifulSoup(doc,"lxml") s = soup.prettify() print("s")如果HTML缺失缺失,beautifulsoup库会自动补缺。BeautifulSoup查找文档元素获取网...原创 2020-02-26 20:35:33 · 822 阅读 · 0 评论 -
numpy库学习及示例
Numpy介绍Numpy是python语言中最基础和最强大的科学计算和数据处理的工具包,如数据分析工具pandas也是基于numpy构建的,机器学习包scikit-learn也大量使用了numpy方法。本文介绍了Numpy的n维数组在数据处理和分析的所有核心应用。本文目录,你将看到 构建numpy数组 观察数组属性的大小和形状(shape) 从数组提取特定的项 如何从现有...原创 2020-03-01 00:20:58 · 684 阅读 · 0 评论 -
数据分析-Matplotlib可视化工具详细介绍
Matplotlib简介Matplotlib是受MATLAB的启发构建的。MATLAB是数据绘图领域广泛使用的语言和工具。MATLAB语言是面向过程的。利用函数的调用,MATLAB中可以轻松的利用一行命令来绘制直线,然后再用一系列的函数调整结果。Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形 。通过Matplotlib,...原创 2020-02-29 15:45:01 · 2045 阅读 · 0 评论 -
手动安装第三方库方法
在虚拟环境直接通过pip install < package >经常会报错如何解决?有如下原因:1.时间超时(可以用:)2.pip升级问题3.安装包名称不正确、未找到这个安装包4.其他pip更新软件包直接运行-cmd 控制台操作查看包 pip list安装a.whl包 pip install a.whl升级包 pip install --upgrade a.whl...原创 2020-04-22 13:25:02 · 2182 阅读 · 0 评论 -
python爬虫技术实例详解及数据可视化库
前言在当前数据爆发的时代,数据分析行业势头强劲,越来越多的人涉足数据分析领域。面对大量数据,人工获取信息的成本高、耗时长、效率低,是否能用代码去完成大量复杂的工作,从而从网络上获取到目标信息?由此,网络爬虫技术应运而生。网络爬虫简介网络爬虫(web crawler,又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种用来自动浏览万维网的程序或者脚本。爬虫可以验证...原创 2020-02-24 11:58:56 · 8247 阅读 · 8 评论 -
网络技术_第一章第一次学习
网络系统结构与设计的基本原则计算机网络的基本机构计算机网络从逻辑功能上分为:资源子网、通信子网1.1 资源子网负责:数据处理业务、提供网络资源、网络服务1.1.1 资源子网由主计算机系统、各种终端联网设备、各种软件与信息资源等组成1.1.2 主机(host)为主计算机系统,资源子网主要组成单位。1.2 通信子网负责进行网络数据传输,转发等通信处理任务,由通信控制处理机计算机网络分...原创 2020-02-18 16:59:36 · 417 阅读 · 0 评论 -
Anaconda安装 详细教程
介绍Anaconda [ænə’kɑndə] 水蟒。它是一个Python语言的免费增值发行版,用于进行大规模数据处理, 预测分析, 和科学计算, 致力于简化模块的管理和部署。下载与安装官网下载:https://www.anaconda.com/打开官网,点击“Download”2.点击链接:https://mirrors.tuna.tsinghua.edu.cn/anaconda...原创 2020-02-18 19:08:27 · 1740 阅读 · 3 评论 -
Python、Jupyter Notebook、Spyder 简单操作教程
Jupyter Notebook 简介Jupyter Notebook是基于网页的用于交互计算的应用程序,适用于Python、R等多种编程语言。打开 Jupyter Notebook双击Jupyter Notebook应用图标打开,电脑弹出应用页面,等待其启动,自动跳转网页(电脑处于联网状态,网页打开后,Jupyter Notebook应用不可退出,否则网页也会失效)或者在浏览器中输入地址...原创 2020-02-18 22:05:42 · 3539 阅读 · 0 评论 -
第五周第一次学习
第二十课时分支顺序分支循环分支分支的基本语法if 条件表达式:语句一语句二语句三…条件表达式就是计算结果必须为布尔值的表达式表达式后面的冒号不能少等级问题,和if一等级的情况...原创 2020-02-18 17:13:50 · 246 阅读 · 0 评论 -
网络技术_第二章第一次学习
中小型网络系统总体规划与设计基于网络的信息系统基本结构包括:网络运行环境、网络系统、网络操作系统、以及基于网络操作系统的网络数据库管理系统、网络开发工具、网络应用系统保证系统安全的网络安全系统、保证正常运行的网络管理系统网络运行环境机房和设备间、配线间电源供电网络系统网络传输基础设施网络设备网络操作系统网络操作系统主要凭借通信设施所提供的数据传输功能,为高层用户...原创 2020-02-19 11:31:34 · 453 阅读 · 0 评论 -
python 安装包、基础学习资料、代码应用示例
安装包python-3.7.0.rar链接:https://pan.baidu.com/s/1Gl5QUMrLFoTekENighd0iw提取码:ysgxpycharm5.0.3.zip链接:https://pan.baidu.com/s/1DpzRiMWSW2byWjB1cYmQKw提取码:9rgiAnaconda3 jupyter notebook第一步进入: h...原创 2020-02-18 17:46:25 · 1813 阅读 · 0 评论 -
第四周第一次学习
第十九课时字符串转义字符串格式化内建函数转义字符用一个特殊的…不同的系统对换行有不同的理解用特殊的字符表示出一些列不方便写出的内容In [1]:ss = “i love \r\n aaaa”print(s)i loveaaaa字符串的格式化把字符按照一定的格式打印或者填充格式化百分号%d放一个整数%s放一个字符串format函数s = “xxx 你好 你...原创 2020-02-18 17:14:20 · 289 阅读 · 0 评论 -
CART——Classification And Regression Tree在python下的实现
分类与回归树(CART——Classification And Regression Tree)) 是一种非参数分类和回归方法,它通过构建二叉树达到预测目的。示例:1.样本数据集2.运行结果-cart决策树的字典max_n_feats = 3时tree_dict = { house :{ yes : agree ...原创 2019-11-19 19:21:32 · 1083 阅读 · 1 评论 -
数据分析_python学习笔记1
第一章为准备工作,可略去2.1 Python解释器2.2 Python基础上面两个小节在之前的学习中已经接触到,便不再赘述。2.3 Python语法基础2.3.1语言的语义2.3.2使用缩进,而不是括号2.3.3万物皆对象2.3.4注释…此后讲到函数的对象方法调用、变量和参数传递、动态引用、强类型、属性和方法、鸭子类型、引入、二元运算符和比较运算符、可变与不可变运算符、标量类型...原创 2019-06-12 21:38:41 · 270 阅读 · 0 评论 -
第三周第二次学习
十二课时(续)e_ww = [1,3,5,9]for shuzi in e_ww :print(shuzi)print(shuzi+123)print(shuzi*100)1124100312630051285009132900In [7]:stu_list = [‘小白’,‘小黑’,‘小红’]for stu in stu_list:if stu == “...原创 2019-05-04 17:27:21 · 478 阅读 · 0 评论 -
第二周第一次python学习
变量第四课时:历史第五课时:变量名→变量名称包含数字、大小写、下划线或者更多,数字不可是首位,在python中,下划线开头的内容具有特殊含义,小写敏感,大小写不一样驼峰命名法:名称以单词自动链接,每个单词第一个字母大写小驼峰:第一个字母小写poslx写法:多个单词用下划线链接,单词全部小写保留字和关键字必须避开:classpython不用提前申明变量...原创 2019-04-26 13:58:14 · 382 阅读 · 0 评论 -
第一周第一次python学习
**python第一到第三课时**原创 2019-04-20 15:33:06 · 336 阅读 · 0 评论
分享