试验python读取外部数据的几种方式

最新推荐文章于 2023-02-02 09:52:45 发布

weixin_43999733

最新推荐文章于 2023-02-02 09:52:45 发布

阅读量748

点赞数 1

分类专栏：算法文章标签： python

本文链接：https://blog.csdn.net/weixin_43999733/article/details/93892850

版权

本文介绍了Python读取CSV文件的三种方式：使用内置的readlines函数，csv模块，以及pandas的read_csv函数。对比了它们的使用方法和特点，适用于小规模数据的读取。

摘要由CSDN通过智能技术生成

摘要

python读取外部csv格式数据，【此处数据非大数据（>6TB），读取大数据利用分段方法】

主要介绍使用python自带的函数read、readlines读取数据转换为数据框，和使用pandas自带的函数read_csv读取csv数据的对比

1、readlines函数读取数据

数据是csv格式，按readlines读取时，每次读取一行，并且把这一行数据作为一个字符串对象；

file="train.csv"
with open(file) as f:
    row=[]
    for line in f.readlines():
        v=list(line.strip().split(","))
        row.append(v)
train=pd.DataFrame(row,columns=row[0])

如下，若csv文件如下：

name	age	height
xiaohong	18	90
xiaobai	20	100
ming	20	NA

用readlines读取的数据是

['name,age,height','xi

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_43999733

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python Twisted 简介

smilejiasmile的博客

12-28

674

原文链接：http://www.aosabook.org/en/twisted.html 作者：Jessica McKellar Twisted是用Python实现的基于事件驱动的网络引擎框架。Twisted诞生于2000年初，在当时的网络游戏开发者看来，无论他们使用哪种语言，手中都鲜有可兼顾扩展性及跨平台的网络库。Twisted的作者试图在当时现有的环境下开发游戏，这一步走的非常艰难，他们迫切地需要一个可扩展性高、基于事件驱动、跨平台的网络开发框架，为此他们决定自己实现一个，并从那些之前的游戏和网络应

python之读取外部数据

weixin_42732240的博客

07-30

366

感谢up主https://www.bilibili.com/video/BV1iZ4y1T7kY ###利用pandas，read_x（）读取数据，x表示带导入文件的格式 ############################################################################ #导入.xls文件，用read_excel() #这里需要先装 pip install xlrd # import pandas as pd # df = pd.read_ex.

参与评论您还未登录，请先登录后发表或查看评论

python读取数据的方法总结

qq_45336930的博客

04-13

350

一、文本类文件 dataset = np.loadtxt(‘test.txt’,delimiter=’,’)

python数据读取操作

lance～crazy

05-14

200

#核心：read_table, read_csv, read_excel import numpy as np import pandas as pd #读取普通分隔数据：read_table #读取txt，csv import os #os模块找到它所在位置 os.chdir('C:/beifen/polymorphism/') data1 = pd.read_table('data1.t...

python访问网页变量_Python 如何访问外围作用域中的变量

weixin_39724748的博客

12-04

118

在表达式中引用变量时，Python 会按照如下的顺序遍历各个作用域，寻找该变量：当前函数作用域任何外围作用域(比如包含当前函数的其他函数)global 作用域，即代码所在的模块的作用域如果上述作用域内都找不到变量，就会报 NameError 异常。但是对变量赋值时，规则会有所不同。如果当前作用域变量已存在，那么其值会被替换。如果不存在，则会视为在当前作用域定义新变量，而不是向外围作用域中寻找。如下...

python之外部数据的读取

godlover的博客

11-05

389

外部数据的读取文本文件的读取 Example # 文本文件的读取 import pandas as pd text = pd.read_csv('data_test01.txt', sep=',', names=['序号', '出生年', '月份', '日期', '性别', '职位', '薪资'], skiprows=2,skipfooter=3,engine='python') print(text) 电子表格的读取 Example excel = pd.read_excel('data_t

Python数据分析（全） #超长预警 #思维导图 #matplotlib #numpy #pandas

七海的博客

04-21

2197

数据分析一、基础概念及环境2. CONDA环境安装一、基础概念及环境数据分析是Python数据科学的基础，也是机器学习课程的基础数据分析：大量的数据进行分析，帮助人们作出判断，以便采取适当行动。 2. CONDA环境安装有的模块可能会互相干扰，所以要创建环境。每造一个项目，都可以创立一个环境。（如果没有特殊需求，没有必要安装）如果pip install装不上的东西，CONDA几...

python

weixin_43936202的博客

07-30

1060

python学习笔记

python-数据分析基础

hero的博客

05-18

2228

模块一：python的基础知识一、基本概念 1、数整数int、浮点数float 2、变量模块二：pandas数据结构一、series数据结构 1、含义： series是一种类似于一维数组的对象，由一组数据与之相关的数据标签（即索引）组成 0 a 1 b 2 c 3 d dtype:object 以上即为series数据结构，第一列数字是数据标签，第二列是具体的数据，数据标签与数据是一一对应的 2、创建一个series 方法：利用pd.Series()，通过给Series()方法传入不同的对象即可实

python读取外部数据_python之读取外部数据

weixin_39833270的博客

12-09

130

感谢up主https://www.bilibili.com/video/BV1iZ4y1T7kY###利用pandas，read_x()读取数据，x表示带导入文件的格式#############################################################################导入.xls文件，用read_excel()#这里需要先装 pip insta...

python中从外部读入数据并进行相应转换

m0_38061927的博客

08-07

2989

在机器学习过程中，离不开大量的数据的训练和测试，而第三方库中所携带的数据库数量又是有限，当我们需要使用自己的数据时，如何将数据从外部读入，并将其转化为训练数据和测试数据？本文将介绍一种数据读入及转化方式，本文以csv格式的文件为数据集作为例子进行读取测试。iris.csv数据集 (ps,若数据集需要积分，百度云链接)首先看看iris.csv数据集长什么样子其为150*4的数据集，共150个样本

python笔记-2020/09/11上午-文件操作：csv

执念永恒print的博客

09-20

163

import os src_path = r"D:\test\func.wmv" dest_path = r"D:\test\func2.wmv" handle_read = open(src_path,"rb") handle_write = open(dest_path,"wb") file_size = os.path.getsize(src_path) has_read = 0 while has_read <= file_size: res = handle_read.read(

selenium自学之路：csv文件读写操作

Daniel_WL的博客

04-15

1099

读取信息 import csv with open('test.csv')as f: f_csv = csv.reader(f) for row in f_csv: print(row) 运行结果： ['test1', '12345', 'sdasda'] ['test2', '44877', 'sdsa'] ['test3', '3243', 'fdsgfd']...

利用Python读取外部数据文件

阿玥的小博客

02-02

7108

往往在集成数据源的时候，可能会让你遇到一种苦恼，那就是你的电脑里存放了很多统计软件自带的或生成的数据集，诸如R语言数据集、SAS数据集、SPSS数据集等。如果你尝试了好多种模块都无法读取某个统计软件的数据，我建议你还是回到R中，R也是开源的统计分析工具，体积也非常小，只有40M左右，而且R自带的foreign包可以读取很多种统计软件的数据集，当读取成功后，再利用write.csv函数将数据集写出为csv格式的数据，这样Python就可以轻松读取csv数据集了，万事灵活一点就可以完成你想要的任何结果~

python 读取远程服务器文件

重剑无锋博客

03-16

5853

import paramiko host_ip='192.168.0.150' #不需要带端口 username='tao' password='tao' remote_path='/home/tao/1.JPG' local_path='/data/1.JPG' def remote_scp(host_ip, remote_path, local_path, username, password): t = paramiko.Transport((host_ip, 22)) t.co.

python读取外部文件数据