使用excel打开文件,修正长度过长的数字后几位变为0的问题

本文介绍了一种方法,可以防止在使用Excel打开CSV文件时将长数字(如订单号)转换为科学计数法。通过正确设置导入过程,确保数据的准确性。

之前一直不知道这个方法,知道的就跳过吧,勿喷。

我们将身份证号,订单号,手机号,银行卡号等存到文本中,但是使用excel打开的时候

通常会变成科学技术法的样式

如果我们是将数据主动存到 excel中可以通过设置单元格格式为文本即可


但是有的时候这些数据并不是从excel录入的,例如我们从网站中导出。
例如商城导出订单信息,订单号往往很长,而且许多网站后台导出的数据是存到
了csv文件中,而这个文件又默认是使用excel打开。当然我们希望使用excel打开,毕竟基于
excel的强大功能。

例如打开后:


可以看到订单是科学技术法的形式,即使上面有比较详细的数据,但是最后两位是0的
(然而实际上这里的订单最后两位并不是0)
我们使用 notepad++ 或者 记事本打开看一下

可见这样显示是合适的
解决办法:
新建一个空白的excel
依次点击 数据--自文本 之后选择你的csv文件


直接下一步

选择逗号,下一步
之所以选择逗号是因为我们之前是使用 记事本打开csv文件的时候发现每个列的数据使用逗号分割的

格式选择文本,点击完成。

直接确定即可(=$A$1 表示从A1开始)
最后效果

打完收工 :)










项目预测二分类问题,以下要求,请生成按要求的代码。使用环境为anaconda ,地址为D:/anaconda/python.exe 原始数据输入算法 对于训练测试阶段只需检查即可,数据直接可以从指定文件夹或文件(可以浏览输入),获取样本文件文件名为例:样本0000后面是编号4位数字即可),文件已经有一个第一行为样本号,第二行是字段名称,第三行开始才是数据,一个时间列(注意不是年月日时分秒的格式,是秒为单位,例00.5、1、1.5……),默认数据列是上部油压、下部油压、钻杆转速、拉线位移(这四个是按用户填写的输入传感器名称来确定)以及钻进孔深(这列数据一开始都是0,会通过孔深实时计算代码实时更新,其不算输入传感器数量里),还有一个预测列(是没有数据的之后测试模型的时候预测)和一个标签列(有数据是0/1),并且不会实时更新已经是完整数据文件。 检查文件格式,如果文件名称是一致的但是是Excel格式的,则另存一个这个文件csv格式,保存地址为原来输入的文件夹里,命名一致,例:样本0000 特征工程逻辑算法 数据离散处理 主要功能是将数据频率为1s三个以上的数据变为1s两个 如果离散化窗口内的数据点小于等于2个就不用进行数据离散处理,即每个数据相隔0.5s,就不用离散化 按用户输入的离散化窗口大小1s和步长0.5s,计算每个窗口内数据的均值并对应到时间序列窗口内的中位数上,对于标签列窗口内有60%以上为1才对应到时间序列窗口内的中位数上是1否则为0,第一个数据即0s时直接用原来的数据不用均值。 窗口补齐原则,训练测试阶段普通窗口内未有数据的时间段与上一个时间一样的数据补齐即可,而最后一个窗口如果有缺数据也是向上一致补齐而标签列直接为0。 最后得到第一行工程号第二行为字段名第三行才是处理后的数据,其中数据包括时间列,若干数据列、标签列和预测列。 最后生成一个csv文件(为了后续数据处理)和Excel(为了方便查看)保存到原来输入的文件夹里,并将文件命名为样本文件的名称+“数据离散处理”,例:样本0000数据离散处理。 识别关注窗口 主要功能是分辨哪段时间是关注时间段 读取数据离散处理刚刚生成的文件,格式是否为第一行工程号第二行为字段名第三行开始才是数据。对于实际运行阶段要注意文件是实时更新的。注意之后要处理的数据都是已经进行过离散化,所以时间点之间间隔已为0.5s。 生成拉线位移变化速率这数据列,此值由字段名称为“拉线位移”的数据生成,公式为:拉线位移变化速率=(本时间点的拉线位移数据-上一个时间点的拉线位移数据)/(本次数据的时间点-上一个数据的时间点)。形成一个时间列,若干个数据列和新增的字段名为“拉线位移变化速率”的数据列,还有一个标签列或者预测列。 按用户输入的关注数据窗口大小和步长(步长大小与关注数据窗口大小一致),判别公式为:均值(绝对值(关注数据窗口内拉线位移变化速率的数值))>=(钻孔钻进误差*计划钻进孔深)/计划钻进时间,即为关注窗口否则为非关注窗口(公式中个别除拉线位移和时间外信息可以从用户交互界面中获得。 钻孔钻进误差默认为5% 计划钻进孔深默认3000mm 计划钻进时间默认:10000s 这里要生成一个关注窗口列,这一列中在关注窗口里的数据标上1,在非关注窗口的标上0。并且对于非关注窗口中预测列也为0 数据特征生成 对于是关注窗口的数据生成特征量,对于非关注窗口不用生成特征量, 这里关注窗口的数据中每条数据点都要生成特征量,特征生成统计大小为10s 识别出文件中字段名称为上部油压、下部油压、钻杆转速、拉线位移和钻进深度(这个值会在study04代码中实时生成)的数据以及,生成特征量的时候要用到。 只对关注窗口进行数据特征操作,特征量有12个,每个特征量只保留3位有效数字,特征量字段名称和计算公式分别为 修正油压差=(同一个时间点的上部油压-同一个时间点的下部油压)+((向下取整(上一个时间点的钻进深度/计划单杆长度)*计划单杆重量)/钻头截面积) 计划单杆长度默认1500mm 计划单杆重量默认1000n 钻头截面积默认10000mm^2 修正油压差变化速率=(本次时间点的修正油压差-上一个时间点的修正油压差)/(本次数据的时间点-上一个数据的时间点) 修正油压差变化速率均值=均值(包括此时间点以上的特征生成统计大小的历史时间的所有修正油压差变化速率),这里的修正油压差变化速率计算方法与上面一个一样。 修正油压差变化速率方差=方差(包括此时间点以上的特征生成统计大小的历史时间的所有修正油压差变化速率) 钻杆转速=此时间的钻杆转速可以直接获得 钻杆转速变化速率=(本次时间点的钻杆转速-上一个时间点的钻杆转速)/(本次数据的时间点-上一个数据的时间点) 钻杆转速变化速率均值=均值(包括此时间点以上的特征生成统计大小的历史时间的所有钻杆转速变化速率),这里的钻杆转速变化速率计算方法与上面一个一样。 钻杆转速变化速率方差=方差(包括此时间点以上的特征生成统计大小的历史时间的所有钻杆转速变化速率) 历史钻进深度均值=均值(除去此时间点以上的特征生成统计大小的历史时间的所有钻进深度) 拉线位移变化速率=在识别关注窗口代码中已经生成过,可以直接使用 拉线位移变化速率均值=均值(包括此时间点以上的特征生成统计大小的历史时间的所有拉线位移变化速率),这里的拉线位移变化速率计算方法与上面一个一样。 拉线位移变化速率方差=方差(包括此时间点以上的特征生成统计大小的历史时间的所有拉线位移变化速率) 形成特征量矩阵(如果出现现有数据不足特征生成统计大小,则用现有的数据有几个算几个的原则,这样情况只会出现在一开始的特征生成统计大小的时间范围内,之后数据在离散化处理的时候已经进行补齐不会出现数据缺失问题): [特征量]=[ 修正油压差,修正油压差变化速率,修正油压差变化速率均值,修正油压差变化速率方差/钻杆转速,钻杆转速变化速率,钻杆转速变化速率均值,钻杆转速变化速率方差/历史钻进深度均值,拉线位移变化速率,拉线位移变化速率,拉线位移变化速率均值,拉线位移变化速率方差] 最后生成一个csv文件(为了后续数据处理)和Excel(为了方便查看)保存到之前输入的文件文件夹里,并将文件命名为样本文件的名称+“数据特征生成”例:样本0000数据特征生成。文件中数据包括时间列、关注窗口列、12个特征量列以及预测和标签列,第一行是样本号,第二行是字段名,第三行开始才是数据。
最新发布
09-19
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值