自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(62)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 项目管理套路:看这一篇绝对够用❤️

写论文必不可少的,就是创建代码并进行实验。好的项目管理可以让实验进行得更加顺利。本篇博客以一次项目实践为例,介绍项目管理的方法,以及可能遇到的问题,并提供一些可行的解决方案。

2023-11-23 17:38:11 737

原创 实验进行套路【1】

实验是用来证明猜想正确与否的关键方法,做好实验对提升论文发表效率至关重要。本篇博客结合自身经历总结做实验的方法论,希望能对读者有用。本篇不会从技术实现角度来介绍做实验的方法,而会从指导思想角度入手。如果你是一个科研工作者的话,相信本篇博客可以帮助到你。

2023-04-19 09:44:05 564 1

原创 操作系统内核与安全分析课程笔记【1】链表、汇编与makefile

链表是linux内核中关键的数据结构。在第二次课中,重点介绍了**循环双向链表**和**哈希链表**。这两种链表都在传统的双向链表的基础之上进行了针对效率的优化。

2023-03-10 11:26:12 496

原创 操作系统内核与安全分析课程笔记【2】进程管理与调度

Linux内核把进程列表存放在叫作任务队列(task list)的双向循环链表中。这个双向循环链表重的每一项都为task_struct、称为进程描述符(process descriptor)的结构。

2023-03-10 11:23:23 474

原创 操作系统内核与安全分析课程笔记【0】环境搭建

本学期选择了游伟和黄建军老师的操作系统内核分析与安全,目前已经试听了第一节课。这门的授课老师建了一个网页用于收录本次课程的幻灯片材料,录屏材料,以及软件安装包等一系列课程用得到的材料。对于学生而言,这是一门既硬核能够学到东西的金课,同时也是一个友好到不会难到让人无法下手的课。出于上述原因,博主打算认真学习这门课,并开通系列博客,记录学习心得。本篇博客介绍了本次课程基础实验环境搭建。

2023-02-28 11:12:46 617 1

原创 强化学习基础知识

强化学习是一种机器学习方法,通过agent与environment的互动,学习适当的action policy以取得更大的奖励reward。本篇博客介绍强化学习的基础知识,与两类强化学习模型。

2023-02-18 11:01:24 1108

原创 数据库查询计划:获取与分类

数据库在得到一个查询后,先将查询转化为一个逻辑查询计划,对其进行优化,然后转为物理执行计划,最后按照物理执行计划进行操作,最终得到最终结果。本篇博客介绍获得数据库查询计划的语法与物理计划的分类。最后按照物理执行计划进行操作,最终得到最终结果。

2023-02-16 15:01:04 520

原创 Fuzz的原理与实现

模糊测试(fuzz testing)是一种自动化的软件测试技术,通常用于识别程序中的潜在漏洞。其概念最早由威斯康辛大学的巴顿·米勒于1989年提出。AFL是一种fuzz方法,目前广泛使用在模糊测试中。本篇博客介绍了使用模糊测试的目的,以及AFL实现模糊测试的原理,并依据案例具体实现AFL。

2023-02-15 18:57:53 3893

原创 差分隐私学习笔记

随着大数据时代的到来,数据隐私日渐成为一个热点问题。本篇博客介绍了差分隐私领域最为基础的3个机制:拉普拉斯机制、指数机制和高斯机制,并给出证明和性质。

2023-02-09 11:10:32 533

原创 python实验实践【2】深度学习的python包

python包的管理是使用python进行实验过程中最为重要的一环,很多时候运行他人代码失败的原因是没能按照对方的要求配置python包库。本篇博客重点介绍深度学习场景中python包的管理。

2022-12-26 11:41:58 602 1

原创 codeblock安装与使用教程

codeblock是c++/c项目实现的一个好工具,相较于dev/eclipse而言codeblock更加灵活简便,易上手。

2022-12-15 23:42:10 1690

原创 postgresql使用教程

postgresql使用教程。

2022-12-12 19:12:52 506

原创 计算机领域热知识【2】消息队列与celery

Celery是实现消息队列的一个工具,本篇博客将介绍消息队列的基础知识,以及celery实现消息队列的总体方法。想要实现用Celery实现消息队列实例的朋友,可以从本篇博客中找到我写的另一篇介绍使用Celery和RabbitMQ实现消息队列的博客。

2022-12-08 15:23:38 594

原创 PostgreSQL在Ubuntu环境下的安装与使用

PostgreSQL在Ubuntu环境下的安装与使用

2022-12-08 14:45:57 1360

原创 Linux设置环境变量

Linux设置环境变量

2022-12-08 14:42:59 711

原创 MySQL在Ubuntu环境下的安装与使用

MySQL在Ubuntu16.04环境下的安装与使用

2022-12-08 14:22:19 391

原创 Log【2022/12】

Log: ottertune env setting, run and tune (fail).

2022-12-08 14:09:18 297

原创 使用Celery+RabbitMQ实现消息队列

Celery always work with redis and rabbitmq.

2022-11-22 17:19:55 1350 1

原创 etcd使用与原理【22Fa】

Etcd Tutorial 2022/11/14Etcd

2022-11-13 12:20:41 256

原创 Group Meeting【2022/11/11】

Group Meeting 2022/11/11Ottertune

2022-11-11 10:52:48 112

原创 套路【2】实验环境搭建

Environment setting is important in run a project.

2022-11-10 11:55:52 511

原创 代码写作套路【5】gdb调试

近期作业使用语言为c++,涉及到gdb调试的具体实现。本篇博客记录gdb调试的相关细节。

2022-10-22 14:29:08 382

原创 开会总结【1】ADL129

ADL会议是中国计算机协会定期组织的讲习班,会邀请计算机各细分领域的领军人物针对当前领域的前沿知识进行一系列的介绍。参加ADL对于了解前沿发展有巨大作用。本期我将概括介绍ADL第129期的具体内容,具体内容还请看官移步ccf官方查看会议总结。

2022-08-23 16:47:07 508

原创 论文阅读【6】Autoaugment: Learning augmentation strategies from data

本文提出的AutoAugment方法可以依据验证集上的损失值自动选择数据增强策略。

2022-07-21 21:49:02 409

原创 论文阅读【5】DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

本文发现特征工程对低阶和高阶交互特征有明显偏向,本文提出了一种既关注低阶特征又关注高阶交互特征的模型:`DeepFM`,并在实验中发现模型有效。

2022-07-01 17:14:23 312

原创 论文阅读【4】Product-based Neural Networks for User Response Prediction

巨大的特征空间给推荐系统的训练带来困难,本篇论文提出一个基于点积操作的神经网络,它用一个嵌入层学习分类数据的分布表示,通过`product layer`学习不同领域特征的交互特征,进而获得高阶特征的交互作用。实验表明`product layer`有效...

2022-07-01 16:09:22 301

原创 论文阅读【3】Deep & Cross Network for Ad Click Predictions

特征工程是许多预测问题成功的关键,但这一过程需要大量人力开销并且依赖于经验知识。DNN是解决这一问题的方法,但这种方法表示特征之间的交互是隐式。本篇论文提出的Deep & Cross Network (DCN)在保证了DNN对于特征交互的基本表示的同时,通过引入cross network使得其在特定阶数的交互关系时更加节省空间,并用CTR实验证明了DCN的这一特性。...

2022-07-01 13:38:27 580

原创 论文阅读【2】PreQR: Pre-training Representation for SQL Understanding

对query的编码方式会影响下游基数估计的准确性,以往的one-hot编码方式无法捕捉复杂语义环境,例如查询的结构,数据库模式的定义和列的分布差异。为了解决这个问题,作者提出了一个新的预训练SQL表示模型。它将语言表示方法扩展到SQL查询。我们提出了一个自动机来编码查询结构,并应用一个图神经网络来编码以查询为条件的数据库模式信息。然后,通过采用注意力机制,建立了一个新的SQL编码器,以支持即时的查询感知模式链接。在真实数据集上的实验结果表明,用我们的查询表示法取代单次编码可以显著提高现有基于学习的模型在几个

2022-06-27 20:27:59 696

原创 论文阅读【1】Leva: Boosting Machine Learning Performance with Relational Embedding Data Augmentation

数据预处理与数据工程是机器学习发展至今的一大瓶颈,好的数据预处理可以极大提升机器学习预测的准确性。然而现在实践中的数据预处理与数据工程主要是基于人的经验,并没有一个可以依赖的强有力算法。本篇论文提出了一个编码数据的方式,自动进行数据预处理与数据工程,节省人力的同时也在实验中取得不错效果。...

2022-06-26 17:18:53 484

原创 计算机领域热知识【1】Transformer与attention

。Transformer的通用性与易训性使得其在自然语言处理领域大方异彩。自2017年提出以来,近5年来大量NLP领域的创新均是基于transformer进行的,例如我们熟知的BERT,GPT2等,均取得良好的实验效果。本篇博客介绍transformer的结构,并提出自己对模型结构的看法。...

2022-06-24 15:24:25 2728 1

原创 代码写作套路【4】项目文件夹构建

实验代码主要由:数据处理模块,数据模块,模型搭建模块,模型训练模块,实验结果导出模块,日志模块,以及自定义模块组成。本文带你从零到一搭建一个项目。

2022-06-08 11:02:28 685

原创 Docker:从安装到使用

Docker解决了不同物理机环境异构导致的代码迁移问题,本篇博客从安装到使用全方位介绍docker使用技巧。

2022-05-10 18:33:30 400

原创 python操作postgresql

postgresql是一个常用的数据库,使用python对其进行过操作可以加快数据提取与处理的速度,本博客介绍从安装postgresql到使用python对数据库进行操作的技术细节,将python和postgresql的使用连接在一起。

2022-04-24 15:19:37 5318

原创 代码写作套路【3】使用pytorch构建模型的2种方法

pytorch是深度学习训练的常用框架,其代码书写有一些可以学习的套路。这个系列的博客将总结pytorch构建深度学习网络并训练的几种套路。

2022-03-24 16:37:35 1341 2

原创 代码集【2】数据分析的相关代码【持续更新中】

目录代码背景代码思路代码实现代码背景实验做完后的数据分析是一个重复性工作,本博客总结了实验结束后总结分析的代码。具体包括以下功能的代码:绘制箱线图:draw_boxplot(chosen_list, result_q_err, x_name_list)得到取值范围在某个区间的比例:get_rate(low, high, chosen_list, result_q_err, x_name_list)得到统计量:get_stat(chosen_list, result_q_err, x_name_l

2022-03-10 01:11:01 458

原创 数据库科普——我们为什么需要数据库

许多东西在学习之初,让人一头雾水。回想起我最开始接触数据库的时候,我也并不是很清楚数据库是做什么的。如果你是一个像当时的我一样不明白数据库是做什么的小白,那么今天这篇博客将十分适合你,请阅读下去,相信读完之后你会明白数据库的用处是什么。目录从一个故事开始数据库的开端数据库是什么——回到最初的问题从一个故事开始小红是一个家政阿姨,她每天的工作是给雇主收拾屋子的卫生,并且将雇主女主人的用品收纳到合适的位置。这一天,小红遇上了一个重大难题:女主人的衣服不好收纳。机智的小红经过一些观察,总结出了这个女主人.

2022-02-27 14:35:22 2415

原创 代码集【1】得到数组中的前k个

目录代码背景代码思路代码实现代码背景vldb summer school 22中写lab0作业过程中遇到了一个可以提升的点在于从一个长数组中获取前k名组成的数组。下面进行形式化定义:A=[a1,a2,a3,a4...an],a1,a2,...an∈NA = [a_1, a_2, a_3, a_4...a_n], a_1, a_2,... a_n \in NA=[a1​,a2​,a3​,a4​...an​],a1​,a2​,...an​∈N 找到可以得到topk数组的函数,其中topk=[amax1,

2022-01-09 22:57:29 533

原创 linux系统基础设置

linux+Ubuntu有许多常用的指令,本篇博客列举这些用法。值得注意这篇博客内容比较杂乱,所以后期这篇博客会一直更新。目录系统环境内存与cpu信息安装语句网络设置gpu使用系统环境一共有3种更改系统环境设置的语句,其中只有source bash.bashrc才会永久生效。在命令行中运行export PATH=$PATH:[new_path],这种方法最简单,但是无法永久生效。更改bash_profile文件,并source bash_profile,这种方法也无法永久生效。更改bash..

2021-11-22 14:58:17 653

原创 conda安装与使用

Conda是一个在Windows、macOS和Linux上运行的开源软件包管理系统和环境管理系统。Conda可以快速安装、运行和更新软件包及其依赖项。本篇博客介绍在linux服务器上安装miniconda的过程并介绍一些使用陷阱的解决方法。目录安装minicondaconda使用遇到的问题虚拟环境Jupyter notebook安装miniconda在miniconda安装主页上有多个版本的Miniconda,可以运行wget [安装包链接]下载安装包。下载好后运行bash [下载的安装包sh文..

2021-11-22 14:26:33 9265

原创 etcd使用与原理【21Fa】

etcd是一种高度一致的分布式键值存储,它提供了一种可靠的方式来存储需要由分布式系统或计算机集群访问的数据。本篇博客介绍初学者应该知道的etcd使用技巧和原理目录安装etcd配置所有节点共同的配置各个节点的特殊配置使用原理安装etcd从官网上列举的各种版本的安装包中选出特定版本的etcd包,下载后解压即可使用,运行./etcd --version可以查看是否成功安装etcd,若成功安装etcd则可以看到etcd的版本信息。配置配置一共分为2个部分:所有节点都需要的配置和每个节点上特殊的配置..

2021-11-22 13:49:13 7454 1

raft协议集群实现.gif

raft协议集群实现.gif

2021-11-22

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除