Python基础之数据读取相关操作

本文介绍了Python中进行数据读取的各种方法,包括文本操作函数、连接MySQL数据库、读取Access文件以及解析Json文件,旨在为自然语言处理的数据准备工作提供便利。
摘要由CSDN通过智能技术生成

        在做一些自然语言处理的相关工作时,总是要读取很多不同类型的文件,作为数据方便后面的处理(包括分词、计算词向量等),因此,受教于本科时期的学长(博客 https://me.csdn.net/alanconstantinelau ),我学习并总结了一些常用的文本的操作函数,方便个人使用和大家学习。

(一)Python常用文本操作函数

import codecs
def writetxt(path, content, code):
    with codecs.open(path, 'a', encoding=code)as f:
        f.write(content)
    return 'OK'
# 写入文本
# 'OK'表示追加写入txt,可以换成'w',表示覆盖写入。'utf8'表述写入的编码,可以换成'utf16'等。



def read_txt(path):
    with open(path, 'r', encoding='utf8') as f:
        lines = f.readlines()
    return lines
# 读取txt文件
# utf8表示读取编码为utf8的文件,可以根据需求改成utf16,或者GBK等。

 

import xlrd
def read_xls(path):
    xl = xlrd.open_workbook(path)
    sheet = xl.sheets()[0]    # 0表示读取第一个工
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值