语言分析
文章平均质量分 80
数据分析 语言处理 R语言
科研小白 新人上路
这个作者很懒,什么都没留下…
展开
-
SCI写作,一定要避开这些“雷点”!
在撰写中文论文时,标题只需体现因素对实施对象产生了影响,因此我们通常会使用“xx药对xx病的研究”“xx药对xx病的治疗效果”作为标题。但在撰写SCI论文时,标题需要将因素对实施对象产生的影响具体化,明确影响产生的方式及其导致的结果。从引用文献中提取出的引用观点应与原文献的主旨统一,并且所引用的文献与所写论文的研究结果应是相通的。这一部分的写作需要我们结合他人的文献进行探讨,因此通常情况下,这部分的引用文献不得少于30篇。在讨论的写作中,应围绕结果阐明自身的观点,同时引用类似文献与自身的研究做对比。原创 2023-02-14 18:01:13 · 487 阅读 · 0 评论 -
基于R语言机器学习方法与案例分析实践技术
是发现新规律,总结和分析实验结果的利器。机器学习涉及的理论和方法繁多,编程相当复杂,一直是阻碍机器学习大范围应用的主要困难之一,由此诞生了Python,R。机器学习已经成为继理论、实验和数值计算之后的科研“第四范式”,以编程简单,方法先进脱颖而出。机器学习算法的实现。原创 2022-09-02 16:48:39 · 348 阅读 · 0 评论 -
七 R语言|箱须图、饼图的绘制
R语言 饼形图 绘图 “Disease”和“Healthy”,R中默认是以字母顺序展示相关的参数,因而“Disease”位于左侧,而“Healthy”位于右侧,而我的绘图数据文件同样是“Disease”组在前,“Healthy”在后,如果你的绘图数据中排在前面的分组字母顺序靠后,则需要调整jitter的顺序,使得。接下来进入正题,开始图像的绘制,首先随便建立一个绘图的数据,饼图的数据其实很简单,就两列,一列是绘制饼图个扇区的数值,另一个是其对应的名字。......原创 2022-09-01 17:34:37 · 922 阅读 · 0 评论 -
六 R语言barplot条形图之带误差棒的对称条形图及相关性分析结果分布
R语言 条形图 绘图,其中涉及到一个图形,作者将筛选出的marker微生物的总丰度与肠道菌群的alpha多样性指数在同一个图像利用对称的条形图进行展示,同时给出了健康和疾病样品间的差异检验结果。还是上一篇推文中介绍的对称条形图的文献,其中包含一个对疾病和健康marker微生物的丰度进行相关性分析,进而使用条形图展示其相关系数分布的图形。图像绘制的命令与正常的条形图绘制基本一致,这里就不再赘述了,详细的参数用法可以参见之前的几篇推文。...原创 2022-08-25 18:33:02 · 1316 阅读 · 0 评论 -
R语言|plot和par函数绘图详解,绘图区域设置 颜色设置 绘图后修改及图像输出
如果bty的值为”o”(默认值)、”l”、”7”、”c”、”u”或者”]”中的任意一个,对应的边框类型就和该字母的形状相似,如果bty的值为”n”,表示无边框。R语言绘图讲解原创 2022-08-23 18:19:55 · 12356 阅读 · 0 评论 -
R软件和扩展包的升级及R语言数据对象
R语言每个一段时间就会跟新一个新的版本,其中会增加一些新的语法、修改一些语法的用法并修复一些bug,因此,相应的扩展包也会进行一些更新以适应新的R版本。即会打开扩展包更新界面,点击Select All选中需要更新的扩展包,点击Install Updates即开始扩展包的更新。更新完成后需要将旧版本R的library文件夹复制到新版本中,不然还要重新下载所有的扩展包。在RStudio中使用如下简单的命令即可自动将R语言更新为最新的版本。的情况,此时就需要对R语言和扩展包进行更新。进入扩展包管理页面。...原创 2022-08-18 18:02:52 · 4293 阅读 · 0 评论 -
扩展包的安装
基本的R语言软件中包含了R语言的所有基本命令,但是这些基本命令远不能满足用户无止境的需求,由于R语言的开源性,目前已经有了各种各样的R语言扩展包用于解决用户的各种需求,这些。有时在安装扩展包时会出现应用命令安装失败的情况,此时可以手动搜索并下载扩展包的压缩文件,解压后放在R软件下的library文件夹即可。大多数R语言的扩展包都已经整合到的CRAN中,此时我们应用R语言的扩展包安装命令即可进行安装。使用一个扩展包中所包含的命令之前首先需要安装扩展包。安装完成之后,需要载入扩展包才能使用其中包含的命令。...原创 2022-08-18 18:00:06 · 858 阅读 · 0 评论 -
R语言的简介和安装
R语言 RStudio默认的工作路径在windows系统中为我的文档,需要将待分析的文件放到我的文档中,才能在RStudio界面找到目标文件。但如果用R进行数据格式的调整以及简单数据的处理确实还不如用Excel方便,同时R在统计分析中的能力也弱于专业的统计学软件。直接使用R语言的软件界面进行工作其实相当的不方便,我们在安装完成R之后,还需要安装另一个软件工具,那就是。注2:RStudio应该与R安装在同一个盘里,比如R安装在E盘,那么RStudio也应该安装在E盘。搜索RStudio的官网...原创 2022-08-18 17:51:47 · 1309 阅读 · 0 评论 -
贝叶斯自举法Bayesian Bootstrap
在本文中我们介绍了贝叶斯自举法, 它的关键的想法是,每当我们的估计量以加权估计量表示时,自举过程就等于用多项式权重随机加权。贝叶斯自举等同于用狄利克雷权重加权,这是多项式分布的连续等效物。具有连续的权重避免了极端的样本,并且可以生成估计量的平滑分布。本文参考作者:Matteo Courthoud声明: 本号旨在传播、传递、交流,对相关文章内容观点保持中立态度。涉及内容如有侵权或其他问题,请与本号联系,第一时间做出撤回。...原创 2022-08-18 14:34:10 · 362 阅读 · 0 评论 -
【教程】DEM差值计算实现农作物株高计算的操作方法
数字高程模型(DEM,Digital Elevation Model)大部分时候,用作地形地貌分析。将概念泛化,提出了数字表面模型(DSM,Digital Surface Model)。可以理解为,DSM数据,把建筑物、植被去除后,就得到了DEM(图1)。根据这个现象,可以用来计算植被的高度。在农业中,可以在播种前获取一景DEM(土壤的高度),每个生长期,获取一景DSM(作物的高度)。二者相减,就得到了各个生长期农作物的高度数据。...原创 2022-08-15 18:36:51 · 824 阅读 · 0 评论 -
教程 | R语言中基于表达数据的时间序列分析
聚类分析大家应该不陌生,今天给大家介绍一个用于基于时间序列的转录组数据的聚类分析R包Mfuzz。此包的核心算法是基于模糊c均值聚类(Fuzzy C-Means Clustering,FCM)的软聚类方法,它的特色就是把聚类的特征进行归类,而不是像K-mean一样的样本的聚类。对于m,它是控制算法的柔性的参数,如果m 过⼤,则聚类效果会很次,⽽如果m过⼩则算法会接近硬聚类(HCM)聚类算法。图中最小的值便是最优的簇数,我们可以进一步进行查找具体的数据:。...原创 2022-08-11 18:49:40 · 1073 阅读 · 0 评论 -
【推荐收藏】C++函数大全
语法:正在上传…重新上传取消下列参数在不同的编译器可能会有所不同, 但是一般是可用的:LINE和FILE变量表示正在处理的当前行和当前文件.DATETIME变量表示当前日期,格式为month/day/year(月/日/年).变量描述当前的时间,格式为hour:minute:second(时:分:秒)._cplusplus 变量只在编译一个C++程序时定义.STDC 变量在编译一个C程序时定义,编译C++时也有可能定义.部分数据展示,详细全部的PDF格式文件领取。...原创 2022-08-04 18:34:21 · 3778 阅读 · 0 评论 -
矩阵求导术(公式超详细讲解上)
矩阵求导的技术,在统计学、控制论、机器学习等领域有广泛的应用原创 2022-07-18 17:06:01 · 118 阅读 · 0 评论 -
BP神经网络进行分类任务
BP(BackPropagation)神经网络是一种按误差逆传播算法训练的多层前馈网络,它的学习规则是使用梯度下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。3数据准备将数据分类训练集(80%)和测试集(20%),训练集训练得到网络的权重,测试集评估网络的泛化误差。损失函数和精度曲线,训练开始,随着损失函数降低,测试集上的精度也在不断降低,但是训练在100轮以后,基本不再提升。4定义BP神经网络定义三层神经网络,即1输入层,1隐含层,1输出层,激活函数使用softmax。...原创 2022-07-15 18:07:28 · 4663 阅读 · 3 评论 -
重剑无锋!15种相关分析算法,总有一款适合你!
相关系数(Correlation coefficient)可用于评估两个变量之间的线性关系,它的值在-1到1之间,-1或1代表完美的负相关和正相关,0表示不存在线性关系。计算相关系数的方法种类繁多,各有自己的定义以及适用情况面对相同的数据,如果采用不同的相关分析,会得出不同的相关系数,如下图: 图片来源: [1]一般来说,如果没有特别注明,我们所说的相关系数,通常指的是Pearson'r,由Pearson相关(Pearson’s correlation)计算得出。不夸张的说,Pearson相关很可能是统计原创 2022-07-14 18:17:32 · 5302 阅读 · 0 评论 -
【建议收藏】Pytorch常见坑详解
pytorch并没有一套属于自己的数据结构以及数据读取算法,dataloader个人感觉其实就是类似于tf中的feed,并没有任何速度以及性能上的提升。先总结一下遇到的坑:1.没有高效的数据存储,cv.imread在网络训练过程中效率低解决方案:当时看到了一个还不错的github链接,https://github.com/Lyken17/Efficient-PyTorch主要是讲如何使用lmdb,h5py,pth,lmdb,n5等数据存储方式皆可以。个人的感受是,h5在数据调用上比较快,但是如果要使用多线程原创 2022-07-13 17:33:55 · 216 阅读 · 0 评论 -
GEE-Python遥感大数据分析、管理与可视化实践
遥感 航天、航空、临近空间 数据的空间、时间、光谱分辨率 数据 遥感数据 大区域、多尺度海量遥感数据处理 地球科学数据 GEE Javascript和Python 时间序列 空间抽样与样地数据提取 机器学习分类算法与精度评估 服务器端影像与影像集数据批量下载.........原创 2022-07-08 17:42:46 · 1292 阅读 · 0 评论 -
图解最常用的10个机器学习算法!(必须收藏)
深度学习 python 图片 机器学习 算法 线性回归 逻辑回归 线性判别分析 分类和回归树 朴素贝叶斯 K近邻 学习矢量量化 支持向量机 bagging和随机森林 Boosting和AdaBoost原创 2022-07-07 17:57:37 · 2328 阅读 · 0 评论 -
收藏! 38个Python数据科研库
Python 数据库 机器学习 数据可视化 解释与探索 Apache Spark .Pandas 3.Dask Scikit-Learn XGBoost原创 2022-07-07 17:44:44 · 620 阅读 · 0 评论 -
4款Pandas自动数据分析神器
数据分析 统计学 可视化 原始数据。了解列数、行数、取值分布、缺失值、列之间的相关关系等等,这个过程叫做 (Exploratory Data Analysis,探索性数据分析) 目前已经有很多工具可以自动产出基础的统计数据和图表,能为我们节省大量时间。本文会对比介绍 4 款常用的工具,最后一款绝了,完全是抛弃代码的节奏。正式介绍这些工具之前,先来加载数据集数据集 DataFrame...原创 2022-07-06 16:45:02 · 295 阅读 · 0 评论