![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
琦度
公众号:「琦度」
展开
-
Pandas去掉数字千分位的逗号的三种方法
问题描述:在日常的数据清洗过程中,我们频繁去处理一些数字,比如说日志,或者说自动生成的报表,这些地方总有着千分位的逗号,这对于数据的后续运算和入库都有着不小的影响,这边将采用三种方法教大家超便捷的处理千分位逗号的问题数据准备import pandas as pda = [[['22,900', '7,100'], ['3,400', '-0.03'], [ '5', '...原创 2020-03-03 23:54:09 · 15066 阅读 · 8 评论 -
数据分析常用方法汇总
写在前面实际的数据分析过程中,其实并不简简单单的使用一些数据技术,还有很多成熟的方法论值得我们去借鉴,当然这些都是企业长期发展过程中进行的总结。之前的文章也说过,数据分析师并不是一个纯粹的程序员,相信我当你只会编程的时候,在找数据分析工作时十之八九是以失败告终。说白了,现在的企业更需要的是业务上的熟练,所以对于一个专注于数据的公号,今天我就从电商的角度跟大家罗列下常用的方法论:其实很多...原创 2020-02-22 20:15:12 · 882 阅读 · 0 评论 -
利用pandas处理缺失数据
工作中少不了各种缺失数据,对其进行处理的方式也可以是各有不同概览dropna : 对缺失数据进行过滤fillna :以特定的方式补充缺失数据isnull :返回布尔对象notnull: isnull的否定1、删除缺失数据dropna()import pandas as pdimport numpy as npdata = pd.DataFrame([[2.3, ...原创 2020-02-16 22:13:17 · 352 阅读 · 0 评论 -
利用pandas对列进行筛选&利用索引/多列值重新排序
实际工作中我们可能遇到,挑选出表格中每一列中的最大值最小值组成新的DataFrame,或者按照索引(日期)、某些列的值进行重新排序,由于内容不多,我就合并在一起写下来给大家参考对列值进行自定义规则筛选1、数据准备import pandas as pdimport numpy as npframe = pd.DataFrame(np.random.randn(4, 3), c...原创 2020-02-15 23:32:30 · 776 阅读 · 0 评论 -
利用pandas调换列的顺序并且删除指定行/列
如果你做数据分析的工作,那么相信我Pandas是你离不开的模块,事实证明它也没有让我们失望,所以将重点记录一些常用方法调换列顺序的l两种方法1、数据准备import pandas as pddata = {'state': ['O', 'i', 'N', 'd'], 'year': [2000, 2001, 2002, 2003], 'po...原创 2020-02-14 23:34:11 · 1610 阅读 · 0 评论 -
最全Ndarray,DataFrame,List之间的相互转化方法总结
可以说这些方法在实际的工作中用的是相当的频繁,我在网上并没有搜索到全面式的总结,当然还有字典(dict)的转化,我会在下一篇博客中总结出来1、 数据准备import pandas as pdimport numpy as npdata = np.array([[1,5,8],[3,6,4],[7,5,1]])df = pd.DataFrame([4,48,5,9])2、 ...原创 2020-02-12 01:59:46 · 1948 阅读 · 0 评论