文件基础读写

python读写

 # 1.导入文本(‘r’,‘w’,‘s’)

txt = open("黑月光.txt", 'r', encoding='UTF-8').read()  # UTF-8避免乱码
newtxt=open("new.txt", 'r', encoding='GBK').read()

encoding也可以设置为范围更广的‘GBK’格式。

‘r’表示只读,‘w’表示写入。

# 2.创建文本

file = open ('处理后文本.txt', 'w')
file. Write(txt)

 将txt中的内容写入file。

# 3.导入表格

ME=pd.read_excel('MEdata.xlsx','MEdata',index_col=0)

   其中,index_col=0表示第一列为index值 。

# 4.导出表格

Table = pd.DataFrame(columns=['词语', '词频'])  # 生成空表
Table.to_excel('黑月光词频统计表.xlsx', index=False)  # 将结果保存为 excel 表

-------------------------------R语言读写---------------------------------------------

# 1.内置数据集和文本

data()   # 查看R中的内置数据集
data(iris)
----------
library(包)
data(package="包")    # 查看包中所有数据集
data(数据集名)         # 具体数据集
# example
library(ggplot2)
data(package="ggplot2")   # 查看包中的数据集
data(diamonds)

----读取文本-------
read.table(file,header,sep="",skip,nrows,rownames)

file:自带包直接为名称,写路径需注意“/”。

-----第一种:设置工作路径-------
setwd(F:/data)
data1<-read.table(file="credit.txt",header=TRUE,sep="")
-----第二种:直接读入完整路径----

header:T or F,表示读取第一行是否为变量名。

sep:分隔符;skip:读取前跳过行数;nrows:读取最大行数。

# 2.读取CSV格式的数据

data<-read.csv(file,header,sep=",")

# 3.读取网页数据

R中读取网页数据需要用到XML包和RCurl包。

读取网页上的HTML表格数据需要函数readHTMLTable()

readHTMLTable(doc,header=NA,colClasses=NULL,skip.rows=integer(),asdata.frame=TRUE)

doc:HTML文件或是URL(网页网址);skip.rows:需要忽略的行。

----------实例-------------

url = getURL('http://datachart.500.com/ssq/history/history.shtml')
table<-readHTMLTable(htmlParse(url),header=F)$tablelist
data<-as.data.frame(table)  # 静态网页表格
data<-data[,-9]  # 剔除第九列空列
names(data)<-c("期号","红球1","红球2","红球3","红球4","红球5","红球6","蓝球",
               "奖池奖金","一等奖注数","一等奖奖金","二等奖注数","二等奖奖金",
               "总投注数","开奖日期")
head(data)  # 前六行

# 4.读取Excel数据

library(readxl)
data<-read_xlsx("C:/Users/wmj/Desktop/分析表.xlsx",sheet="Sheet1")

# 5.保存导出数据

write():仅作用于矩阵和向量的特定列。

write(x,file="data")
-----实例----
x<-matrix(1:10,ncol=5)
write(t(x),"F:/data/x.data"  # 

write.table();write.csv()---------导出列表数据和数据库数据。

write.csv(retval,"runoob.csv")

# 6.读取csv.gz压缩文件

library(R.utils)   # 解压csv.gz文件
gunzip("raw.csv.gz", remove = TRUE)   # 删除源文件,保留压缩后的csv文件

# 7.导出value为excel文件

library(openxlsx)  # 声明包
a<-colnames(A)     # value
a<-data.frame(a)   # 将value转换为data
write.xlsx(a, file = file.path("C:/Users/wmj/Desktop/聚类GSE71585标签.xlsx"))

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值