python数据导入spss_Python/Excel/SPSS/SQL数据处理方法比较之1 - 数据导入

本文比较了Python、Excel、SPSS和SQL在数据导入方面的不同方法,涉及本地数据、数据库数据的读取。Python常用pandas的read_csv和read_excel;Excel可以直接打开文件,或通过“获取外部数据”导入;SPSS能直接打开sav文件,通过ODBC导入数据库数据;SQL使用Navicat的导入向导,或SQL语句进行数据迁移。
摘要由CSDN通过智能技术生成

前言

我知道这个标题很唬人,但容我解释两点:首先我是说【数据处理】,不是数据分析更不是数据挖掘,只涉及从获得数据到开始正式分析之前的准备工作,也称【数据清洗】;其次,这只是【比较】,只是比较粗浅的罗列而已,整理一下我最近俩月驳杂的学习内容。

首先介绍使用版本与工具:Python:Python 3.6.6(Anaconda custom)/Jupyter Notebook、pandas、numpy

Excel:Office 365(2016)

SPSS:Statistics 25

SQL:MySQL 8.0/Navicat Premium 12.1

然后提一下背景知识:列(Python/Excel)=字段(SQL)=变量(SPSS)

行(Python/Excel)=记录(SQL)=个案(SPSS)

OK,LET'S DANCE.

Python本地数据

这里说的是读取为pandas的数据框DataFrame格式。首先需要导入pandas和numpy:

import numpy as np

import pandas as pd

一般使用pandas读取表格型数据。如果是本地文件,如csv或xlsx,则常用两个函数:

df=pd.read_csv('路径')

df=pd.read_excel('路径')

这里的路径需要使用反斜杠\,但

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值