之前一直用的Python处理数据,工作当中用到的数据是从后台导出,然后再用pandas处理Excel。
平常倒是没什么问题,但是遇到领导突然要几个月或者要半年甚至一年的数据的时候,Python读1G的数据就很卡很慢了,领导可不会等你慢慢卡。
然后就想到可以把每个月的数据都先存到数据库,用数据库先筛选,再用Python处理,就会快得多。以前用过navicat for mysql,但数据太大的话,好像也不是很好用。于是就开始安装了oracle。
oracle的安装下载oraclejingyan.baidu.com
我是下的这个文件进行安装的,提醒一下,安装的关键步骤(比如安装位置、数据库名、数据库口令等),最好截图保存下来,不然以后出什么问题忘记了,就麻烦了。
安装步骤就按照网页说的一步一步安装下去。
PL/SQL SERVER安装
oracle安装完毕之后当然可以用,但是我还是安装了PL/SQL,就像Python的anaconda一样,属于一个编辑器吧,而且我的原始数据是Excel,PL/SQL可以导入csv进去。
安装完pl/sql之后,需要连接到oracle数据库,可以按照以下方式连接PLSQL连接本地的Oracle数据库_百度文库wenku.baidu.com
一切都准备好之后,就可以用PLSQL登陆数据库,导入数据、查询数据了。
导入数据
PL/SQL可以导入csv/txt文件的,我的是xlsx,只能先转成csv,然后再导。创建表格
导入数据之前,你的数据库里面需要先有这个表名存在。