记一次excel数据整理

记一次excel数据整理

背景:现有1000多条客户数据生成的pdf文件。想要将成整理出来成可自由查询导入导出的excel格式,或者更进一步导入数据库中。

做法如下:

  • Pdf分割
  • 利用wps工具转化word格式
  • 从word中将表格数据拷贝到excel中
  • *整理excel中的数据
  • 将excel的数据存入txt格式
  • 将txt格式导入到mysql中
  • 在mysql中操作数据

pdf分割

为什么要pdf分割,因为wps转化工具限制(免费版只能一次转化5页)。干这一步的原因主要是哥没有钱。
网上pdf分割工具有很多,如http://www.ilovepdf.com/zh_cn/fencai_pdf
这个操作就不多说了。

pdf转化为doc格式

这个网上有很多工具,但是最近发现wps这个广告弹窗不少的国产软件竟然推出的“金山PDF转Word”工具还不错。大家可以用一下。

我就是使用的该工具转化成的。基本上不变型,特别是表格。但是出现好多好多隐藏的单元格。这就不得不在拷入excel进行格式处理。而格式处理是一个很繁琐的工作。

将数据从doc中拷入excel中

该步不多说了。

整理excel数据格式

技巧一 定位功能的运用

定位 空值 删除 空行

技巧二 if的运用

=if(or(d1="男",d1="女"),d1,d1&e1)

这个是用在下面这个情况

DEF
李制环科院
张红XX公司

这可以新建一列,在新建一列中输入判断语句就可以将一些单元格数据合并了。

技巧三 复制值

excel中,可以复制公式后,会引用原公式产生的值,可以选择式粘贴为值。

技巧四 存为txt格式

为了导入mysql中,可以将单张表存为txt格式
存储格式如下

1   张X  男   巡视员 住建部         
2   徐X  男   董事长 XX设计研究总院            
3   吴XX 男   副院长 XXX设计研究总院           
4   张X  男   副院长 XXX设计研究总院           
5   李XX 男   总工程师    XXX股份有限公司           

中间空格实为’\t’

导入mysql

按excel中字段顺序建好mysql表格。
然后使用如下命令导入

use antdz_oa;/*使用antdz_oa数据库*/
load data local infile 'D:\data.txt' into table oa_customer fields terminated by '\t';
835丁彩娟副编审《中国给水排水》杂志社022-27835913
836彭秀华编辑《中国给水排水》杂志社022-27835707
837刘贵春编辑《中国给水排水》杂志社022-27832819
838金晟会计《中国给水排水》杂志社022-27836823
839孙磊广告部《中国给水排水》杂志社022-27835592

优化数据库

上面的那个表格中单位重复太多,我想在mysql中建一个单位表用于储备单位
先建一个单位表(oa_unit)

idtitle
int(8)varchar(100)

mysql命令,将oa_customer中的单位写入oa_unit中

insert into oa_unit(title) select distinct unit from oa_customer;

写入oa_unit表后,再把oa_unit的单位的id对于单位名称写入oa_customer中。

 update oa_customer,oa_unit set oa_customer.unit_id = oa_unit.id where oa_customer.unit = oa_unit.title;
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值