windows下数据挖掘比赛提交文件换行符问题

在Windows环境中参与天池、腾讯等数据比赛时,由于默认CRLF换行符导致提交文件格式错误。解决方案是使用dataframe以二进制模式保存CSV,确保LF换行符。VSCode提供便捷工具,可切换行尾序列和选择文件编码,避免乱码问题。
摘要由CSDN通过智能技术生成
1. 问题
  • 在天池大数据比赛、腾讯算法比赛等中都需要提交结果文件,一般是csv文件
  • win下的默认换行符是CRLF(回车换行),linux或macos下的默认换行符是LF(换行),这些比赛要求提交的文件大多数都需要是LF换行符
  • 我是在windows10下使用vscode敲代码的,代码也是在win10下跑的,如果不留心,就会生成CRLF换行符的文件,提交结果总会出现没成绩、格式错误、表头信息错误等问题(例如近期的阿里妈妈广告预测比赛和腾讯广告算法大赛,都存在由于换行符不对导致的格式错误的问题)
2. 解决方案

对于数据挖掘、算法类的比赛,一般都是使用dataframe来存储、操作数据,最后结果也会使用dataframe.to_csv来保存csv文件。最简单的解决方案就是使用二进制方式写文件即可,其实这个方法对txt文件也有效:

import datetime
time_format = '%Y-%m-%d-%H-%M-%S'
time_now = datetime.datetime.now()
file_name = 'result/result_%s.csv'%time_now.strftime(time_format)

# result是一个dataframe
result.t
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值