自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(59)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 【论文精读】node2vec: Scalable Feature Learning for Networks

本文是我参加Datawhale的CS224W图机器学习时的笔记,第一次学习图机器学习,对node2vec的理解。node2vec也是在DeepWalk和LINE基础上,同样借助自然语言处理领域的词嵌入思想。主要改进了DeepWalk僵硬的随机游走节点选择策略,提供了可以调参的节点选择策略。可以捕捉到节点的同质社群信息和功能角色信息

2023-02-26 22:19:36 551

原创 【论文精读&实战】DeepWalk: Online Learning of Social Representations

本文是我参加Datawhale的CS224W图机器学习时的笔记,第一次学习图机器学习,对DeepWalk这篇开山之作的理解。

2023-02-19 12:26:13 1043

原创 generator、iterable、iterator傻傻分不清楚

本文重点介绍Python中生成器和迭代器的概念、源码实现。从generator引入,然后介绍iterable和iterator,包括Python3判断对象是否为可迭代的方法、判断对象是否为迭代器。

2021-11-26 19:06:35 734

原创 机器学习实战—KNN

主要介绍人工智能领域的分支——机器学习。机器学习的大致分类,详细解释了KNN算法的几个重要知识点

2021-02-08 21:14:00 406

原创 计算机体系结构基础引言

PPT在我们的日常生活中经常会被用到,工作汇报、宣传演讲、授课讲座……都离不开它的参与,它的外表很简单,在键盘上轻轻一按或者在鼠标上轻轻一点,PPT就进入了下一页,然而在计算机内部,实现它的过程并不简单,一个简单的翻页涉及到了计算机方方面面的参与,它们构成了整个计算机体系结构

2020-08-26 13:35:08 510 1

原创 Java Web前后端分离项目—后端servlet实例

前后端分离,前端vue+axios。后端Tomcat服务器,mysql数据库。采用SpringMVC模式。servlet中用post方式接受前端传递的json数据并返回。完整解决方案,附带前端小姐姐方案链接

2020-05-07 18:55:51 4453 4

原创 前后端对接及接口管理平台浅析

本文主要简略介绍前后端对接的接口概念。Tomcat的结构介绍。Fastjson及json的建议用法和接口管理平台NEI的介绍。

2020-04-29 14:24:29 3329

原创 那些有趣的java—封装

封装是java学习中必不可少的概念,理解封装有助于加深学习影响。本文主要介绍封装思想,java中的包,this和static关键字以及代码块的含义

2020-04-05 11:18:40 417

原创 LAMP(Ubuntu 18.04)安装jdk13,Tomcat详细操作

本文主要介绍云服务器LAMP(Ubuntu 18.04)安装jdk13和Tomcat的详细步骤。其中Tomcat安装不需要手动配置环境变量

2020-03-21 11:19:11 1546 1

原创 java数据类型浅析之字符串(二)

一;不可变字符串String 两种创建方式第一种String handle = new String([string_content]);Handle句柄,[]表示可写可不写。我先分析一下这段代码1、new String;指的是在堆空间中创建一个String类型对象2、末尾的([string_content]);调用String类的构造方法初始化值为"string_content"...

2020-03-19 23:30:01 278 1

原创 java数据类型浅析(一)

非java方向的小伙伴们刚开始学习可能会遇到一些问题,我就把我刚开始学的时候遇到的问题总结一下,大家可以互相讨论。java数据类型浅析(二)数据类型分为除了字符型和布尔型,其他的基本数据类型都是有符号的。而且Java中的基本数据类型所占存储空间固定,不随操作系统的变化而变化。这使得java具有可移植性和平台无关性。(我们在网课上也学到了跨平台性,我认为这就是一种具体体现)这里在推荐大家...

2020-03-19 23:27:19 722 1

原创 图理论基础

本文是Datawhale图深度学习组队学习,主要介绍了图聚类系数的理论溯源,其知识点在论文中的出处

2024-04-15 10:26:25 619

原创 Logistic Regression

详细解释了Logistic Regression的原理,背景和损失函数、优化的目标函数、优化算法-梯度下降。以及包含上述概念的数学推导

2024-04-11 12:11:55 533

原创 动态规划解决马尔可夫决策过程

本文介绍了动态规划思想应用于解决马尔可夫决策过程求解方法。包括策略迭代和价值迭代。以及在免模型情况下,使用蒙特卡罗和TD方法解决的思想

2024-01-24 10:44:12 998

原创 强化学习入门

本文介绍了强化学习基本概念和马尔可夫过程、马尔可夫奖励过程、马尔可夫决策过程的性质、奖励函数、回报、状态价值函数、Q函数以及其差别。

2024-01-18 00:03:56 844

原创 Xtuner实战+LLM微调

本文介绍了基于Xtuner工具对InternLM模型进行微调,包括数据集的处理和配置文件的处理

2024-01-16 18:30:40 438

原创 书生.浦语大模型LangChain实战

书生.浦语大模型结合LangChain和Gradio实战案例,传统大模型提升思路

2024-01-11 16:28:15 970

原创 书生.浦语大模型实战一

书生.浦语大模型的大致介绍以及开发平台的示例运行介绍

2024-01-09 23:23:29 1156

原创 用于图节点分类的标签传播系列算法

本节是CSW224第一部分的最后一节(semi-supervised node classification),用一部分已知标签的节点去预测剩下的未知标签的节点。注意:半监督与监督学习不同,这里将已经学到的模型泛化到上,仅仅是对原图的剩余节点进行分类,因为在学习模型时,原图的未知标签的节点也可能用于训练。这种被称为,与之相对应的是。对于图神经网络,是可以做到归纳式学习。

2023-02-27 17:48:30 1039 2

原创 机器学习-决策树

决策树系列算法介绍和实战,未完待续!决策树算法的大致流程如下:注:下图的数据集为后续操作的训练数据集特征是机器学习中自变量的别名。特征选择就是在一系列自变量中选择出对分类最有用的变量。特征选择是一个较大知识领域,主要目的是筛选出对项目目标有帮助的样本属性。在决策树中,特征选择有三大主流方法,分别是信息增益、增益率、基尼系数。其中信息增益和增益率都是由Quinlan创造的。参考西瓜书第十一章特征选择与稀疏学习信息增益参考文章随机事件x,发生概率的对数的相反数。或者随机事件x带给我们的信息量。用I(x)表示,单

2022-06-24 18:25:07 350

原创 机器学习模型评估指标和调用方法

回归模型的评估指标有平均绝对值误差、均方误差、均方根误差、R平方值、Huber损失、Log-Cosh损失函数。也称L1损失(MAE)是预测值与真实值之差的绝对值,计算公式如下:MAE=1n∑i=1n∣fi−yi∣=1n∑i=1neiMAE = \frac{1}{n}\sum_{i=1}^n{|f_i-y_i|}=\frac{1}{n}\sum_{i=1}^n{e_i}MAE=n1​i=1∑n​∣fi​−yi​∣=n1​i=1∑n​ei​以下是sklearn中调用MAE的示例代码:均方误差也称L2损

2022-06-03 15:21:10 1032

原创 PyTorch模型构建指南

在这里,我们引入神经网络块的概念。块(block)可以描述单个层或、多个层组成的组件或者整个模型本身。可以通过递归的方式将一些块组合成更大的组件。从编程的角度来看,块由类(class)表示。 它的任何子类都必须定义一个将其输入转换为输出的前向传播函数, 并且必须存储任何必需的参数。 注意,有些块不需要任何参数。 最后,为了计算梯度,块必须具有反向传播函数。 在定义我们自己的块时,由于自动微分(在 2.5节 中引入) 提供了一些后端实现,我们只需要考虑前向传播函数和必需的参数。在构造自定义块之前,我们先回顾一

2022-05-31 22:25:46 1615 1

原创 HDFS编程实践

接下来介绍Linux操作系统中关于HDFS文件操作的常用Shell命令,利用Web界面查看和管理Hadoop文件系统,以及利用Hadoop提供的Java API进行基本的文件操作。在学习HDFS编程实践前,我们需要启动Hadoop。执行如下命令,开启 和 守护进程。启动时可能会有 WARN 提示 “WARN util.NativeCodeLoader…” 如前面提到的,这个提示不会影响正常使用。启动完成后,可以通过命令 来判断是否成功启动,若成功启动则会列出如下进程: “NameNode”、”Dat

2022-05-31 22:21:22 1653

原创 labelme&labelImg

图像标注工具labelme&labelImg安装介绍

2022-05-31 22:13:37 1790

原创 Paddle极简方案快速构建手写数字识别模型-V1

通过paddle paddle提供的基础API搭建一层神经网络,用于识别MNIST数据集,准确率25%,此为极简方案,目的是让同学们快速入手深度学习框架的使用。主要涉及数据处理、模型设计、训练和测试

2022-05-31 22:12:52 1223 2

原创 Git分支管理

本文参照廖雪峰Git教程,在原作基础上进行些许删改,案例的替换。

2022-05-31 22:05:15 3028

原创 Git远程仓库

介绍了Git本地仓库如何与第三方Git托管平台-码云进行联动,以及SSH协议的部分介绍

2022-05-31 22:04:14 5524

原创 Git基本命令 <一>

本文目录结构参考廖雪峰Git教程,内容在原文基础上有所删改。以总结记录为主

2022-05-31 22:03:27 159

原创 Git分布式版本管理系统前世今生

从版本管理系统的前世今生入手,进而介绍Git的起源和历史,结合参考文献资源的引用,特别是对Linux Torvalds的原文采访的引用。

2022-05-31 22:02:24 465

原创 机器学习-模型评估与选择

本文基于DataWhale集成学习第二章:机器学习基础内容和周志华老师的《机器学习》第二章模型评估与选择整合而来,主要介绍了模型评估与选择的目的、方法和步骤。其中训练误差和测试误差、偏差和方差的均衡介绍了有关测试误差的内在关联。估计测试误差介绍了直接估计和间接估计两种方法。在测试误差能够被合理的估计出来以后,我们做特征选择的目标就是:从p个特征中选择m个特征,使得对应的模型的测试误差的估计最小。介绍了最优子集选择和向前逐步选择。以及压缩估计(正则化)和降维(PCA)

2022-05-31 21:11:26 291

原创 天池工业蒸汽量预测-模型调参

本文改编自《阿里云天池大赛赛题解析-机器学习篇》工业蒸汽量预测的模型调参。进行了部分素材的替换和知识点的归纳总结。新增了Datawhale8月集成学习中的网格搜索、随机搜索的内容

2021-10-19 17:54:37 433

原创 天池工业蒸汽量预测-模型验证

本文改编自《阿里云天池大赛赛题解析-机器学习篇》工业蒸汽量预测的模型验证。进行了部分素材的替换和知识点的归纳总结。新增了周志华-《机器学习》中的模型评估,以及Datawhale8月集成学习中的偏差与方差的均衡。新增了Lasso和岭回归的调用方法

2021-10-18 22:16:36 737

原创 工业蒸汽量预测-模型训练

本文改编自《阿里云天池大赛赛题解析-机器学习篇》的第一部分工业蒸汽量预测的第四章-模型训练的内容。根据原有内容进行了部分素材的替换和知识点的归纳总结。sklearn模型训练步骤的总结,以及对线性回归、K近邻回归、树回归、随机森林和LightGBM回归的使用介绍

2021-10-14 11:01:35 933

原创 工业蒸汽量预测-特征工程

本篇是《阿里云天池大赛赛题解析-机器学习篇》的第一部分工业蒸汽量预测的第三章-特征工程的内容,并附带了一些知识点的网页链接。内有数据预处理、特征降维等内容。

2021-10-09 20:47:36 1437

原创 Python的第三方库minepy安装解决方案

简要介绍了Python的第三方库minepy的基本信息、重点介绍在python和Anaconda中的安装过程,包括查询python对应的whl版本和pip的默认安装路径的选择

2021-10-04 22:23:01 10390 26

转载 机器学习基础-sklearn全流程实战

本文改编自Datawhale2021年8月集成学习,加入了一些自己的修改和注解。重点介绍了优化模型;训练均方误差与测试均方误差;偏差-方差的均衡;特征提取;压缩估计;降维

2021-08-31 21:55:45 554 1

转载 机器学习所需要的高数知识

本文是源于Datawhale8月集成学习第一章数学基础的高等数学小节,增加了一些概念的解释链接和部分代码的注释,希望对大家有所帮助

2021-08-23 19:02:14 674

原创 工业蒸汽量预测

本文主要介绍阿里云天池大数据平台的学习赛——工业蒸汽量预测。文章内容来自《阿里云天池大赛赛题解析》以及我自己的理解。涉及到的技术点包括数据分析、缺失值、异常值的处理、新变量生成、多种数据可视化(KDE、线性回归、直方图、Q-Q图、箱形图)以及特征变量之间的相关性计算、热力图展示因内容较多,此后会不断更新

2021-05-26 22:00:19 3895

原创 那些年我与Anaconda的相爱相杀

一定要手动配置环境变量,不要自动配置在开始-Anaconda-Anaconda Navigator。打不开找了一堆资料后,尝试后也没打开,也正常,对于这种集成度很高的软件安装肯定不会很顺利。同样的一个问题发生可能是由不同的细微原因引起的,有的很简单,有的很复杂。所以我们一定要去发现自己的错误原因。那么去cmd去运行试试吧首先找到anaconda-navigator.exe 位于F:\Anaconda\pkgs\anaconda-navigator-1.10.0-py38_0\Scripts> 当然盘符要

2021-03-28 20:09:07 559 3

原创 那些你不知道python知识点

本文主要列举了一些平常很少用的python知识点

2021-02-25 23:07:42 102

同源策略详细介绍文档

**同源策略**是指在[Web浏览器](https://zh.wikipedia.org/wiki/排版引擎)中,允许某个网页[脚本](https://zh.wikipedia.org/wiki/腳本)访问另一个网页的数据,但前提是这两个网页必须有相同的[URI](https://zh.wikipedia.org/wiki/统一资源标志符)、[主机名](https://zh.wikipedia.org/wiki/主機名稱)和[端口号](https://zh.wikipedia.org/wiki/通訊埠),一旦两个网站满足上述条件,这两个网站就被认定为具有相同来源。此策略可防止某个网页上的恶意[脚本](https://zh.wikipedia.org/wiki/脚本)通过该页面的[文档对象模型](https://zh.wikipedia.org/wiki/文档对象模型)访问另一网页上的敏感数据。

2020-05-07

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除