近期踩坑以及一些小tips

问题一:

>>> for x in range(1, 13):
...     locals()['double_{0}'.format(x)] = x * 2
... 
>>> double_3
6

在Python中使用循环来命名变量 - IT屋-程序员软件开发技术分享社区Using a loop in Python to name variables(在Python中使用循环来命名变量) - IT屋-程序员软件开发技术分享社区https://www.it1352.com/770788.html

问题二:

我手里的CSV文件行数只有1019,但是列数有5万多列,因此还得先进行转置;然后进行文件拆分;转置完成以后,因为文件里面数据内容,产生了不必要的行和列,得手动删

为了防止以后网址失效,还是贴一下吧!(不是我写的!!!!)

import pandas as pd


def transpose_csv(csv_path):
    """
	csv文件转置
    :param csv_path: csv文件路径
    :return:  转置后的 csv 文件
    """
    # 读取csv文件
    df = pd.read_csv(
        csv_path,
        encoding='gbk'  # 修改编码
    )
    # 转置
    df = df.T
    df.to_csv(
        csv_path,
        encoding='gbk'  # 修改编码
    )


if __name__ == '__main__':
    transpose_csv(r'lrb_002086.csv')

size = 3000
df = pd.read_csv('/input/path/input.csv')

for i, g in df.groupby(df.index // size):
    g.to_csv(f'/output/path/chunk{i}.csv', index=False)

pandas csv 文件转置_夏华东的博客的博客-CSDN博客_csv文件转置#!/usr/bin/env python# -*- encoding: utf-8 -*-"""@Introduce :@File : test2.py@Time : 2021-06-10 14:46@Author : xia hua dong@Tel : 173 179 76823@Email : 17317976823@163.com@pip : pip install """import pandas as pdhttps://blog.csdn.net/weixin_44493841/article/details/117780258?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~aggregatepage~first_rank_ecpm_v1~rank_v31_ecpm-1-117780258.pc_agg_new_rank&utm_term=pandas%E5%B0%86csv%E6%95%B0%E6%8D%AE%E8%BD%AC%E7%BD%AE&spm=1000.2123.3001.4430
如何根据 pandas 中的行数(包括每个文件中的标题行)将 csv 文件划分为较小的文件?icon-default.png?t=M276https://stackoverflow.com/questions/64480388/how-to-divide-a-csv-file-into-smaller-files-based-on-row-count-in-pandas-includ

问题三 

Flask基础之返回值与form表单提交 - 626 - 博客园icon-default.png?t=M276https://www.cnblogs.com/fengqiang626/p/11889033.html

问题四

Python:从两个列表中分别取出一个元素组成一个新的列表_冷的方程式的博客-CSDN博客list1 = [1,2,3]list2 = [4,5,6]length = len(list1)list3 = [[list1[i],list2[i]] for i in range(length)]print(list3)结果:https://blog.csdn.net/weixin_42011794/article/details/123078942

问题五

《使用Python和Dask实现分布式并行计算》4. Loading data into DataFrames(从不同数据源加载数据得到DataFrame) - 古明地盆 - 博客园楔子 数据科学家面临的一个独特的挑战是倾向于研究静止的数据,而非动态的数据,或者不是专门为预测建模和分析而收集的数据。这和传统的学术研究有很大的不同,在传统的学术研究中,数据是经过仔细和深思熟虑之后才https://www.cnblogs.com/traditional/p/13772215.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值