python读取dta文件_python – 带有大型.dta文件的Pandas read_stata()

最新推荐文章于 2023-02-28 11:59:46 发布

weixin_39557419

最新推荐文章于 2023-02-28 11:59:46 发布

阅读量3.6k

点赞数

文章标签： python读取dta文件

这是一个对我来说很方便的小功能,使用了一些在最初提出问题时可能无法使用的熊猫功能：

def load_large_dta(fname):

import sys

reader = pd.read_stata(fname, iterator=True)

df = pd.DataFrame()

try:

chunk = reader.get_chunk(100*1000)

while len(chunk) > 0:

df = df.append(chunk, ignore_index=True)

chunk = reader.get_chunk(100*1000)

print '.',

sys.stdout.flush()

except (StopIteration, KeyboardInterrupt):

pass

print '\nloaded {} rows'.format(len(df))

return df

我在100分钟内加载了一个11G Stata文件,如果我厌倦了等待并点击cntl-c,那么有一些东西可以玩.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39557419

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python读取dta文件_python – 带有大型.dta文件的Pandas read_stata()

这是一个对我来说很方便的小功能,使用了一些在最初提出问题时可能无法使用的熊猫功能：def load_large_dta(fname):import sysreader = pd.read_stata(fname, iterator=True)df = pd.DataFrame()try:chunk = reader.get_chunk(100*1000)while len(chunk) > ...
复制链接

扫一扫

pandas保存dta数据(to_stata):UnicodeEncodeError: ‘latin-1‘ codec can‘t encode characters in position 0-1

weixin_45090765的博客

06-17

1285

解决pandas保存为stata格式数据时的UnicodeEncodeError问题

Python 读取stata文件

wojiaodabai的博客

04-23

1万+

利用Python读取stata文件，并防止中文乱码。其中 load_large_dta用于读取stata文件，decode_str用于编译中文字符串。 import pandas as pd import numpy as np import os from pyecharts import Geo, Map def load_large_dta(fname): impor...

参与评论您还未登录，请先登录后发表或查看评论

Python读取dta数据（自己学习专用）

m0_56106056的博客

02-28

3048

给自己学python数据分析作记录

Python Pandas 导入dta文件的方法

abracadabraa的博客

10-07

1万+

STATA的dta文件原来也可以由python直接读入，记录一下方法： f=r'D:\file_location\file_name.dta' name=pd.read_stata(f)

python读取dta文件并转化为dataframe

weixin_47585011的博客

10-03

1816

码住，学习 import os import pandas as pd def Load_dta(filename): import sys reader = pd.read_stata(filename,iterator =True) df= pd.DataFrame() try: chunk = reader.get_chunk(100*1000) while len(chunk)>0: df=df.appen

Python|读取dta文件并录入csv格式

weixin_41608080的博客

01-22

6479

#导入pandas包 import pandas as pd #读取dta文件 data = pd.io.stata.read_stata('E:\filename.dta') #写入csv，并且转码。 #如果不转码的话，中文会出现乱码的情况。看过很多教程都是转的utf-8，但是我试过还是会乱码。换成ansi就好了。 data.to_csv('E:\filename.csv', encoding = 'ansi') ...

Python库 | syngenta_digital_dta-0.0.44.tar.gz

04-15

资源分类：Python库所属语言：Python 资源全名：syngenta_digital_dta-0.0.44.tar.gz 资源来源：官方安装方法：https://lanzao.blog.csdn.net/article/details/101784059

Python库 | syngenta_digital_dta-0.0.33-py3-none-any.whl

04-26

资源分类：Python库所属语言：Python 使用前提：需要解压资源全名：syngenta_digital_dta-0.0.33-py3-none-any.whl 资源来源：官方安装方法：https://lanzao.blog.csdn.net/article/details/101784059

Python对CSV、Excel、txt、dat文件的处理

09-20

本文介绍的是Python对CSV、Excel、txt、dat文件的处理，具有一定的参考价值，需要的朋友跟随小编一起来看下

stata命令：GWT转dta 或者GAL转dta

06-02

stata命令：GWT转dta 或者GAL转dta

python读写stata 的一个坑

allzh123的博客

11-25

3342

最近用pandas读取stata然后在保存成dta。首先读取dta文件，然后开始处理数据，最后保存dta的时候，准备将原始数据文件的variable_labels存进去。结果报错 D:\anaconda\envs\tensorflow\lib\site-packages\pandas\io\stata.py in _write_variable_labels(self) 2251 ...

Stata-Python交互-8：将Stata数据导入Python

Stata连享会

06-29

1196

全文阅读：https://www.lianxh.cn/news/17c9d76816839.html 目录 1. 在 Stata 中调用 python 2. 使用 sfi 模块读取 Stata 数据 3. 将数据转换为数据框或字典 4. 将 Stata 数据集完全复制 5. 结论 6. 参考资料 7. 相关推文 Stata16 已开发了与 python 交互的功能，本小节我们将介绍如何在 Stata 中调用 python，将 Stata 的数据导入至 python 中。我们熟悉的读取

使用pandas读取dat文件完整解决方案

热门推荐

xiaoxiaojie521的博客

08-13

2万+

使用pandas读取dat文件完整解决方案 import csv data = pd.read_csv(‘文件名.dat’,header=None,encoding=‘utf-8’,delimiter="\t",quoting=csv.QUOTE_NONE) 这里使用的是相对路径

python pandas 读取.txt .dat 文件时，跳读头文件，并把数据读成数组

weixin_41108410的博客

03-22

2万+

# -*- coding: utf-8 -*- """ Created on Wed Mar 21 19:03:02 2018@author: Administrator """import pandas as pd import numpy as np path1= '/home/chenze/MSTdata/xh-mst20120424' path=path1+'/XHT_MST01_DJH_

pandas 模块学习

拱头的专栏

12-08

2万+

pandas模块方法有两个 1.在windows下安装pandas，只安装pandas一个包显然是不够的，它并没有把用到的相关包都打进去，这点是很麻烦的，只有等错误信息出来后才知道少了哪些包。我总结了一下，一共需要安装如下包： pyparsing-2.0.2.win32-py2.7.exe matplotlib-1.3.1.win32-py2.7.exe openpyxl-open

Pandas数据分析02——各类文件的读取和导出

weixin_46277779的博客

07-27

2090

利用pandas读取csv，excel，stata，spss，sas，sql，html，json，剪贴板等文件

用pandas读取大文件

hengcall的博客

05-20

1万+

读取上GB大文件的方式有很多，但是并不是都有像pandas这样强大的数据清洗功能。数据太大是，可以分块处理，及时手动删除内存，最后在合并数据。今天在读取一个超大csv文件的时候，遇到困难：首先使用office打不开然后在python中使用基本的pandas.read_csv打开文件时：MemoryError 最后查阅read_csv文档发现可以分块读取。 read_csv...

解决 pandas 读取数据时内存过大的问题

微信号：RunsenLiu

04-17

3491

解决 pandas 读取数据时内存过大的问题背景：在我们使用pandas进行数据处理的时候，有时候发现文件在本地明明不大，但是用pandas以DataFrame形式加载内存中的时候会占用非常高的内存，这是因为pandas的处理机制默认会按照最大的规格去设置数据类型。数据类型占用内存表格常用的数据类型范围如下所示： dtypes 范围下限（含）范围上限（含） unit8 0

pandas读取大批量数据报错情况，处理方法

yiweiwei516的博客

06-01

415

pandas.read_table报错情况处理

python读取dta文件

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交