R语言
提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加
例如:第一章 Python 机器学习入门之pandas的使用
提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档
CSV文件操作
一些额外操作
#获取当前路径
getwd()
setwd('E:/R_work')
读取test.csv中前6行第一列的数据
library("DOSE")
a <- c()
data <- read.csv("test.csv",header = FALSE)
data
for(n in 1:6){
s <-as.character(data[n,1])
a <-append(a,s)}
a
orgDb(基因ID转换工具)使用
准备工作
#安装包
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("org.Hs.eg.db")
使用方法(SYMBOL->ENTREZID)
#使用例子
library(org.Hs.eg.db)
ensids <- c("A", "A2M", "ABCC2","ANXA5", "LRRC8A", "LRRK2")
x<-org.Hs.eg.db
keytypes(x)
select(x,keys = ensids, columns = 'ENTREZID', keytype = 'SYMBOL')
一、pandas是什么?
示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
二、使用步骤
1.引入库
代码如下(示例):
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
2.读入数据
代码如下(示例):
data = pd.read_csv(
'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())
该处使用的url网络请求的数据。
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。