- 博客(46)
- 收藏
- 关注
原创 SSH 隧道:如何让本机借用服务器网络
数据分析师与开发者的网络配置不应是“全开”或“全关”,而应是**“精准按需”**。Jupyter 等开发服务交给 VS Code 自动转发。比如连接服务器内网数据库或全局代理。让浏览器自己判断流量该去哪。
2025-12-22 12:45:57
504
原创 从数据库到回归方程:变量处理的“艺术”与“陷阱”
摘要: 本文探讨分类变量在数据存储与分析中的处理差异。数据库通常用数字编码(如1/2)以提高效率,但统计分析需语义信息,需转换为因子(Factor)或哑变量(Dummy Variable)。R语言中因子可自动处理哑变量转换,而Python需手动编码。避免直接数字编码再转因子,以防语义丢失和基准错误。不同场景建议:R优先用因子,Python显式编码,树模型依分类性质选择标签或独热编码。最佳实践强调清洗阶段还原标签,建模前明确基准组,确保分析流程严谨高效。
2025-12-22 11:27:31
261
原创 SSH 隧道与反向代理:如何让服务器“借用本地网络”与“推文件”
在网络世界里,“隧道”就是一种偷天换日的技术。想象一下,你发出的某些 HTTP 请求如果直接丢进公网,防火墙(GFW 或校园网关)一眼就能看到内容并拦截。SSH 隧道就像是一辆装甲运钞车。它把你那封敏感的明信片,塞进了一个加密的金属箱子(SSH 协议数据包)里。运钞车开过防火墙,防火墙只知道这是一辆 SSH 车,不知道里面装了什么,于是放行。到达目的地(你的服务器或代理节点)后,箱子被打开,取出明信片,继续投递。隧道就是在一条已建立的连接(如 SSH)内部,开辟出一条秘密通道,传输其他协议的数据。
2025-12-10 16:44:49
281
原创 全栈开发网络配置指南:Cursor、WSL 与 远程服务器
本文档详细介绍了如何配置本地代理、WSL环境和Cursor编辑器,以及建立SSH反向隧道的方法。主要内容包括:1)区分正向代理与反向隧道概念;2)Windows本地代理设置要点;3)WSL连接宿主机代理的具体步骤;4)Cursor编辑器代理配置和内存优化技巧;5)通过SSH反向隧道让远程服务器使用本地网络。文档提供了从基础配置到高级应用的完整解决方案,并附有常用命令速查表,帮助用户在不同环境下实现网络连接和AI工具使用。重点解决了代理配置、网络连通性测试和远程服务器网络共享等实际问题。
2025-12-10 15:48:22
615
原创 Docker 是什么?Docker 和 Conda 的区别
Conda 管的是语言依赖;Docker 管的是整个环境(用户空间 + 程序 + 依赖)。特性CondaDocker管理范围Python/R 包整个用户空间 + 程序 + 依赖隔离级别低高可移植性中极高部署一般专业级是否包含操作系统用户空间❌✔是否包含内核❌❌是否适合生产部署❌✔Conda = 语言级环境管理Docker = 系统级容器化环境Docker 容器可移植、隔离、可复现,适合开发、部署和协作。
2025-12-08 17:32:38
1048
原创 R 语言 S3 和 S4 泛函数
泛函数 = 根据对象 class 自动选择方法的函数S3:简单、灵活、无需注册、宽松S4:正式、严格、需定义 class & generic、签名检查两者都实现多态,但理念不同:S3 = “约定大于强制”S4 = “显式大于隐式”如果你需要轻量、简单的面向对象 →用 S3如果你需要严谨的结构化代码 →用 S4setClass("Person",name是一个 slot,对象必须有这个字段age是一个 slot二者的类型必须严格符合和"numeric"
2025-11-29 15:43:27
840
原创 R 包中的生命周期触发函数全解析
在 R 包开发中,有一些特殊的,它们会在包被等不同阶段自动触发,用于执行初始化或清理操作。本文总结了所有这些函数的,并提供了完整的示例代码。
2025-11-05 11:46:18
1039
原创 处理 rstudio-server 卡死问题
RStudio 启动缓慢/卡死问题排查指南 RStudio 启动异常通常由以下原因导致: 大尺寸工作空间文件(.RData)加载 .Rprofile自动执行耗时操作 包冲突或损坏 RStudio状态文件损坏 残留R进程占用资源 【解决方案】 清除会话文件:rm -rf ~/.rstudio/sessions/* 和 ~/.local/share/rstudio/sessions/* 终止残留进程:通过rstudio-server active-sessions查询PID后执行rstudio-server k
2025-10-30 14:48:26
382
原创 通过染色体pos定位到cytoband
加载包# 构建查询 URL(chr:start-end)# 默认 grch 38# 可选 grch 37# 查询。
2024-12-23 11:20:14
603
原创 如何使用 MungeSumstats
1、怎么读取 vcf 数据?2、不同方法需要的汇总数据格式不尽相同,每次处理都好麻烦。3、怎么这个 GWAS 缺失 SNP 列。4、怎么去除ambiguous SNPs?5、一些 SNP 号都不对,还有重复。MungeSumstats 可以解决这一切!!!
2024-12-19 16:29:19
1425
原创 通过交互式网页学习相机成像原理
入门摄影这门艺术,你是否有以下这些问题?焦距、光圈、CMOS是什么?为什么光圈越大,背景虚化效果越好?什么是过曝?今天我将分享一个简单的、可交互的相机成像模型,可供大家以可视化的方式深入学习和理解这些术语。
2024-11-10 12:49:13
763
原创 Markdown、Latex公式教程推荐
在Markdown中编写时,文本存储在扩展名为.md或.markdown的明文文件中。然后呢?如何将标记格式的文件转换为HTML或可打印的文档?简单地说,您需要一个能够处理Markdown文件的Markdown应用程序。有很多可用的应用程序——从简单的脚本到看起来像Microsoft Word的桌面应用程序。尽管他们的视觉差异,所有的应用程序做同样的事情。和Dillinger一样,它们都将markdown格式的文本转换为HTML,以便在web浏览器中显示。
2024-11-01 09:50:50
579
原创 写 R 包教程
usethis::create_package("myRpkg") # 在当前路径创建 myRpkg/ 文件夹(包框架)# 1、只需要引用包中的某个函数,在你的函数中需 通过:package::fun() 使用。# 即从函数的代码和注释中生成标准化的帮助文档文件、以及 namespace 文件。# 当我们的包依赖于其它包/函数时,需要说明,以在函数安装及调用过程中正确处理。# 3、建议下载 (安装过程中不会安装此包),通常是代码示例需要。# 1、在 myRpkg/R/ 下创建 R 脚本。
2024-10-20 18:00:45
828
原创 如何安装以及使用 Jupyter
或安装完成后,可查看安装的 jupyter 相关软件有哪些以及版本选装 jupyter_contrib_nbextensions或jupyter labextension install @jupyterlab/git # 安装扩展pip install jupyter_contrib_nbextensions # 安装扩展jupyter contrib nbextension install --user # 启用扩展。
2024-10-16 11:55:25
1395
原创 项目数据处理及管理
1、将一个项目拆成多个部分,每个部分有每个部分的code:按编号记录 code 顺序,每个script 包含注释data:存放处理后的 rawdatares:结果部分,可根据改 part 生成存放不同结果的路径tmp:临时存放中间文件数据的地方2、最外层有个生成所需路径的 bash 或 ipynb 文件。
2024-09-27 12:30:53
484
原创 不打开markdown文件运行其中的代码
Rmd 文件转化为 R 脚本,不运行 R 代码# doucumenation:0、不输出注释# 1、输出函数外注释# 2、输出所有注释。
2024-09-26 19:40:56
415
原创 descrTable常用方法
一个 “公式” 类的对象(或可以转换为该类的对象)。的右侧必须以加减法方式纳入包含项,或为纳入所有变量。左侧必须包含分组变量的名称,或者可以留空(在这种情况下,将为整个样本提供描述性统计数据,并且不进行测试)。: 一个可选的数据框、列表或环境(或可通过强制转换为数据框的对象),包含模型中的变量。如果在data中找不到变量,则这些变量会从中获取。: 逻辑值,指示是否显示 ‘[ALL]’ 列(未按组分层的所有数据)。如果定义了分组变量,则默认值为 FALSE;如果没有组,则为 FALSE。
2024-09-21 23:00:37
1961
原创 解决R包依赖版本不兼容问题
install.packages(“路径/包名.tar.gz”, repos = NULL, type = “source”)等工具管理项目的依赖,这些工具允许您锁定项目中使用的包的版本,从而确保在不同的开发环境中包的版本一致。如果包的版本不兼容,您可以到CRAN或包的GitHub页面查找以前的版本,并手动下载旧版本的。有时候新版本的包可能不兼容或者带来了一些不需要的变化,您可以指定安装旧版本的包。函数来查看包的依赖关系,确保安装的其他包满足依赖版本要求。#使用remotes包安装指定版本的包。
2024-09-21 00:21:39
5736
原创 R包compareGroups详细用法
一个命名字符向量,包含 ‘all’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’ 组件,指示 ‘[ALL]’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’(可用数据)的标签。可能的值有:‘tiny’、‘scriptsize’、‘footnotesize’、‘small’、‘normalsize’、‘large’、‘Large’、‘LARGE’、‘huge’、‘Huge’ 或 ‘same’(允许部分匹配)。
2024-09-20 22:51:39
2424
原创 使用源代码编译R包的过程
R 包编译过程包含配置、编译源代码、链接库、安装等多个步骤。每个步骤都依赖于包的内容(是否有 C/C++ 代码、外部库依赖等)。编译时的控制:通过指定头文件路径,通过PKG_LIBS指定库文件路径和库名。动态链接器不会在编译时使用,它仅用于运行时查找共享库。
2024-09-18 21:11:23
1940
原创 卷积公式的几何学理解
以 X 为例,根据代码 marginal_x = np.sum(f_XY, axis=1) * (y[1, 0] - y[0, 0]) 可知,这就是对公式的代码化表达。当 Z=0 时,概率密度为 0.25左右,对应图 B 中过原点,斜率为 0.5 的直线上对应的 X和Y 值。事件A和事件B同时发生的概率等于事件A发生的概率乘以事件B发生的概率,即:事件A,B是否发生不受另一事件的影响。之前讲了单个随机变量的概率密度函数,两个随机变量的概率密度函数,那么两个随机变量组成的新的随机变量,其概率密度函数是什么?
2024-09-01 22:15:41
1986
原创 为什么 from . import * 不会导入子模块
它只会导入当前模块中定义的顶层变量和函数,而不会递归地导入子模块。文件中显式导入你希望包含的子模块。并不会自动导入子模块。模块被正确导入,并且可以在。时,Python 会根据。通过这种方式,你可以确保。在 Python 中,
2024-07-25 16:55:47
391
原创 解决R语言找不到系统库导致的报错
系统库(System library)是一组预先编写和编译好的软件模块集合,用于支持操作系统的基本功能和提供一些常见的服务。这些库通常由操作系统或第三方开发者提供,并且在系统安装过程中被预装或者用户可以额外安装。常见的系统库包括标准C库(如libc)、图形用户界面库(如GTK+、Qt)、网络库(如libcurl)、数据库访问库(如libmysqlclient)、加密库(如OpenSSL)等。
2024-07-21 20:51:11
1999
原创 教程分享:通过python库自动化操作windows软件
Pywinauto是一个用于Windows应用程序的GUI自动化库,适用于Python脚本。这个库提供了简洁的API来访问和操作Windows GUI元素,使自动化各种Windows应用程序变得简单。通过模拟用户操作,它可以驱动Windows应用程序,并且不仅支持传统的Win32 API,也支持微软的UI自动化(UIAutomation API, UIA)技术。使用pywinauto,测试者和开发者可以创建脚本来自动执行按钮点击、文本输入、窗口控制等典型的GUI操作,实现测试用例的自动化执行。
2024-04-21 21:54:22
2833
1
转载 解决Rstudio automatically be signed out
该提示的作用即字面意思:60 mins 不操作就退出,此举虽是出于保护用户的目的,但是对我来说并不需要。auth-stay-signed-in-days=30 #自动保持登录的天数。rsession-which-r=/usr/bin/R # R的路径。形象的的来说,就是将上面左图变成右图,具体操作也比较简单。auth-timeout-minutes=0 #自动退出的时间。修改或添加如下参数,若只需达到上图效果则只用改动。,其余参数可在需要的时候再进行修改。www-port=8787 # 端口。
2024-04-18 10:47:39
560
1
原创 R运行LDpred时bigparallelr 报错:Error: Two levels of parallelism are used. See `?assert_cores`.
在并行设置中存在问题,即同时应用了两种冲突的并行层次。这在R中会发生,当计算设置了大于1的核心数目,同时默认启用了并行BLAS库时。
2024-04-16 21:34:43
611
1
原创 Slurm作业系统
在公共集群中使用SLURM作业调度系统进行任务的调度和管理。SLURM (Simple Linux Utility for Resource Management)是一种可用于大型计算节点集群的高度可伸缩和容错的集群管理器和作业调度系统,被世界范围内的超级计算机和计算集群广泛采用。控制节点(Head Node)和计算节点(Compute Node)。这是Slurm集群的主节点,负责整个集群的管理和协调。在控制节点上,需要安装Slurm的控制节点组件,包括slurmctld。
2024-03-01 23:19:36
2915
原创 并行计算:利用多线程跑循环
在数据分析和计算密集型任务中,利用多线程运行循环非常重要,这种操作成为并行计算(Parallel Computing)。并行计算利用了多核处理器的能力,将复杂的计算任务分散到多个处理单元上同时执行,可以大幅度提高计算效率和节省宝贵的时间。随着现代计算机多核心处理器的普及,我们可以通过并行处理技术同时在多个核心上执行任务,相比于传统的单线程顺序执行,这种方法能更好地利用硬件资源。多线程特别适合于独立重复的任务,比如大数据集的处理,模型的多参数模拟,以及需要重复计算的情景。
2024-02-20 22:29:19
1385
原创 安装Linux系统(单/双系统)
装Linux系统或设置双系统有其必要性。首先,Linux开源操作系统提供更高度的自定义和灵活性,使用户能够根据需求定制系统。其次,Linux系统在稳定性和安全性方面优于其他操作系统,对于注重这些方面的用户更为吸引。另外,一些开发人员和技术爱好者可能需要Linux进行软件开发和系统调优。对于需要同时运行不同操作系统的用户,设置双系统提供了在同一设备上切换操作系统的便利,满足多样化的使用需求。总的来说,装Linux系统或设置双系统可以满足不同用户的不同需求,提供更灵活、安全和稳定的操作环境。
2024-02-13 17:24:11
2131
1
原创 本地和服务器之间文件自动同步备份
Rsync(Remote Sync)是一个用于在本地和远程系统之间同步文件和目录的开源工具。它专注于高效、快速和智能的数据传输,具有一些独特的特性,使其成为广泛应用的文件同步和备份工具。我们可以通过该命令将本地文件同步到服务器,同样也可以将服务器文件同步到本地!!如果想优雅地实现同步备份任务,单靠这一个工具是行不通的,(每次传输文件都要输入密码的话太麻烦)(运行一次 rsync 命令只能同步一次)
2024-02-12 16:40:19
3084
1
原创 Shell 编程
Shell编程语言是一种脚本语言,主要用于编写Shell脚本。这种语言的主要目的是简化和自动化与操作系统的交互,通过一系列命令和控制结构来完成特定的任务。Shell编程语言并非像传统编程语言(如C、Java)那样被编译成机器码,而是由Shell解释器逐行解释执行。
2024-02-09 16:53:32
1218
1
原创 肺功能单数据提取与自动录入(三):图像方向识别模型训练
本文干货满满,强烈建议仔细阅读并跟着项目运行一下!!!本文将分享:①方向分类识别模型训练数据集准备;②通过Paddle AIstudio平台训练并导出模型;③批处理图像获得方向标签并根据标签信息转正图像。
2024-01-28 22:55:46
1976
1
原创 肺功能单数据提取与自动录入(二):Demo展示
可以看到,用户只需将肺功能单图片打包并传到 /home/aistudio 工作路径,再点击运行全部cell即可获得结果文件。可以说是非常的方便!感兴趣的小伙伴可以先看一看本项目的资源和代码。下一篇文章将分享如何准备方向分类训练数据、如何训练方向分类模型以及如何根据推理结果转正图像。
2024-01-21 10:30:00
480
原创 Windows上配置完整Linux开发环境(五):Ubuntu系统安装Rstudio-server
虽然在Linux系统上可以直接运行R程序,或者用VScode编辑运行R代码,但终究不如Rstudio方便。因此,在wsl下的Ubuntu系统安装Rstudio-server(即Rstudio服务器),再通过window浏览器连接Ubuntu系统的Rstudio-server即可优雅地使用Rstudio。
2024-01-20 19:13:59
2362
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅