自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 Bismark与BSMAP(笔记)

BSMAP将每个甲基化位点的甲基化状态用一个二进制位表示,1表示甲基化,0表示未甲基化,从而将甲基化信息压缩到BAM文件中。总之,BAM格式文件是甲基化测序数据比对和甲基化位点鉴定的重要输出结果,它们可以被用于后续的甲基化位点分析和差异分析等研究。比对结果:每个序列与参考基因组的比对结果,包括比对上的参考序列名称、起始位置、终止位置、比对方向、比对质量等信息。甲基化信息:每个Cytosine位点的甲基化信息,包括其在参考基因组上的位置、甲基化状态、甲基化水平等信息。

2023-04-19 17:29:06 981

原创 R语言绘制累计积分密度图(笔记)

axis.text=element_text(colour="#36648B"),axis.ticks.length=unit(.4,"lines"),axis.ticks=element_line(#坐标轴刻度线的设置。values = c("red", "green"), #manual: 直接指定分组使用的颜色。sum_excel_data<-read_excel("路径.xls",col_names=TRUE)#x、y轴标题颜色、大小、字体、位置。#x、y轴标题颜色、大小、字体、位置。

2023-03-30 21:22:11 237

原创 putty基础知识【screen】(笔记)

此时会退出并挂起虚拟终端(保存会话,后台运行该虚拟终端),此时会话状态变成Detacted。最简单的对比理解就是:attached模式在前台运行,detached模式在后台运行。Linux下批量修改文件及文件夹所有者及权限chmod 770 路径。给screen命名 screen -S name。强制关闭一个screen窗口+screen命名。在Attached状态下,按。

2023-03-30 21:12:35 187

原创 细胞测序/质控+基因比对+合并日志文件+featurecount(笔记)

fastp/fastq进行质控fastp/fastq进行质控。

2023-03-30 21:07:14 205

原创 putty保存连接信息(笔记)

直接输入主机号,点击save。下次登陆的时候主机号就已经存在。putty保存主机号以便下次登录时不用输入。

2023-03-30 20:47:44 278

原创 putty修改普通用户密码(笔记)

1、普通用户自己修改密码(前提知道自己旧密码,可以登陆上putty)sudo passwd 用户名。2、管理员修改普通用户密码。

2023-03-30 20:32:19 544

原创 类别不平衡问题1——1(笔记)

偏差指模型的预测结果和实际结果之间的平均差距,可以理解为模型本身的你和能力,如果模型拟合不足,无法捕捉到数据的实际特征,导致预测结果与实际结果的偏差较大,我们称之为偏差较高的欠拟合模型。方差是指模型在不同数据集上预测结果的差异,可以理解为模型的泛化能力。如果模型过拟合,会对训练集过于敏感,对未知数据的预测能力较差,我们称之为方差较高的过拟合模型。一组数据的变异程度。在统计学中,方差是衡量一组数据离散程度的指标,它衡量的是每个数据值与数据集平均值的距离的平方的平均值。模型在新的、未知的数据上预测能力。

2023-03-30 10:46:24 61

原创 特征选择(笔记)

温度控制决定了算法在搜索过程中接受劣解的概率,随着搜索的进行,温度逐渐降低,接受劣解的概率也逐渐降低。接受概率的计算是根据当前温度和系统的能量差来计算的,能量差越大,接受概率越高。原理:比较两个变量的联合分布和各自分布之间的差异,如果差异显著,则认为它们之间存在非线性关系。包裹式特征选择是在模型训练过程中进行的,它将特征选择看作是一个搜索问题,通过不断的选择和排除特征来优化模型的性能。:将问题的解表示为染色体的形式,通过模拟自然选择、交叉和变异等过程,不断优化染色体的适应度,最终得到最优解。

2023-03-30 10:15:57 195

原创 K折交叉验证和留一交叉验证(笔记)

剩余的k-1个子集作为训练集,重复k次取平均值。k折交叉验证能够使用更多的数据进行训练,但是时间是留一交叉验证的k倍。,其余作为训练,重复n次取平均值。留一交叉验证能够使用最多的数据进行训练,但是计算时间是k折交叉验证的n倍。K折交叉验证和留一交叉验证都是常用的交叉验证方法,用于评估和选择一个机器学习模型的性能。K折交叉验证:将训练集分成k个子集,每次使用一个。每个样本都作为测试集一次。通常,k折交叉验证适用于。

2023-03-30 09:34:44 798 1

原创 Arcmap软件中将地图上的省/市/区/县的名称显示出来

首先打开Arcmap软件,最上方的菜单栏找到customize——Toolbars——Draw,调出Draw面板点击 A 右方的下三角,选择“Label”,鼠标悬浮在地图上将会出现该地区的名称,然后当你鼠标落地它出现的是中文名称。首先双击打开提前导进去.shp格式的邯郸市地图图层属性面板,选择Symbology——左侧Shwo——Categories——Unique values,左侧值字段选择“名字”,然后点击Add all values点击确定。下图展示的就是最终效果。

2023-03-29 20:16:24 10895

原创 机器学习、深度学习、强化学习、规则学习(笔记)

智能体可以使用不同的算法和技术来实现不同的任务。反向传播算法的优点是可以训练具有多个层次的神经网络,并且可以处理大量的非结构化数据,例如图像、语音和文本。它可以表示为从当前状态开始,智能体采取某个动作后,在未来的所有时间步中所能获得的期望奖励的总和。价值函数可以帮助智能体评估当前状态和动作的好坏,策略函数可以指导智能体选择最佳的动作。智能体可以使用不同的算法和技术来学习最优价值函数和策略函数,以实现最优决策。强化学习的主要思想:通过与环境的交互来学习最优策略,通过奖励和惩罚来调整策略,从而实现最优决策。

2023-03-29 19:35:54 893

原创 地理分布分析图+Arcmap(学习链接)

http://datav.aliyun.com/portal/school/atlas/area_selector 获取地理信息,如邯郸.json文件 https://jingyan.baidu.com/article/f79b7cb3af2476d044023ede.html某个字段符号化(将邯郸市各个区县显示出来Arcmap软件)https://lbs.amap.com/demo/javascript-api/example/3d/map3d 高德地图热力图。

2023-03-29 18:01:25 35

原创 如何使用arcmap绘制核密度图(笔记)

选择Geoprocessing——ArcToolbox(进行双击),接下来找到Spatial Analyst——Density——Kernel Density(双击),第一行Input Point or polyline features选择你导入的带有经纬度数据(.shp格式),选择下方的Environments(双击),找到processing Extent(选择你所选区域地图),再找到Raster Analysis——Mask(选择你所选区域地图),点击OK。导进去就出现你所需的地图形状。

2023-03-29 17:49:28 2023

原创 使用Python绘制邯郸地区散点图

from pyecharts.charts import Geofrom pyecharts import optionsfrom pyecharts.globals import GeoTypefrom pyecharts.globals import CurrentConfig, NotebookTypefrom pyecharts import options as optsfrom pyecharts.globals import GeoTypeimport pandas as p

2023-03-29 16:50:53 164

原创 使用Python编程实现将.json格式转成.shp格式(笔记)

plt.rcParams['font.sans-serif'] = 'Microsoft YaHei' # 设置字体为微软雅黑。plt.rcParams['font.sans-serif'] = 'Microsoft YaHei' # 设置字体为微软雅黑。data = gpd.read_file(r'路径\文件名.json')prd_city = ['邯山区','丛台区','复兴区']data.to_file('SHP/文件名.shp',prd.to_file('SHP/文件名.shp',

2023-03-29 14:13:06 1246

原创 使用Python编程根据地址输出地址+经纬度(笔记)

##############读入地址 ------转成数组格式-------------根据高德API接口输出经纬度。jsonData=json_data['geocodes'][0]['location']#获取经纬度。df = pd.read_excel(r'路径\文件名.xlsx', usecols=[0],# 也可以直接写成 address = ['地点1','地点2','地点3'] 的形式。# 也可以直接写成 address = ['地点1','地点2','地点3'] 的形式。

2023-03-29 14:01:52 1981

原创 输出pyecharts版本号

2.0.1。

2023-03-29 11:21:45 49

原创 使用Python编写代码,实现经纬度转成详细地址

jingdu = str(114.523376)#(data['经纬度'][1400].split(",")[0])# weidu = str(36.585729)#(data['经纬度'][1400].split(",")[1])data = pd.read_excel(r'文件路径/文件名.xlsx', usecols=[0],jingdu = (data['经纬度'][i].split(",")[0])weidu = (data['经纬度'][i].split(",")[1])

2023-03-29 11:18:38 1117

原创 统计学常用图形以及直方图和条形图的区别(笔记)

直方图的横轴表示数据的取值范围,纵轴表示数据的频率或者频数。条形图适用于比较不同类别或者组的数据,横轴表示数据值,纵轴表示类别或者组/条形图的条形宽和间距通常是相等的,条形的高度表示数据的大小或者比例,例如:不同产品的销售额、不同地区的人口数量等。2、箱线图:用于表示数据的分布情况和异常值,将数据分成四分位数,箱体表示数据的中间50%范围,上下须表示数据的最大值和最小值,异常值用点表示。8、等高线图:用于表示数据在三维空间中的分布情况,将数据在三维空间中用等高线表示,等高线的高度表示数据的大小或者密度。

2023-03-29 10:45:45 2958 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除