Python 数据分析
文章平均质量分 82
本菜鸡学习数据分析的记录
白御空
想像真正的火箭一样,起飞
展开
-
使用 dict 对象创建多重索引 DataFrame
使用 dict 对象创建多重索引 DataFrame原创 2023-01-04 17:31:33 · 1001 阅读 · 0 评论 -
NumPy 基础 --- 【使用 NumPy 进行数据分析】
NumPy 基础原创 2022-02-01 23:52:39 · 1718 阅读 · 19 评论 -
熵权法求权重
熵权法求权重创作背景知识补充熵熵权法求权重过程一、特征缩放归一化标准化注二、求熵三、求权重实战一、特征缩放二、求各特征的熵三、求个特征权重结尾创作背景最近本菜鸡在帮别人搞个 熵权法求权重 ,给的数据是差不多 5 份打分表,有字段和对应的打分,要我求一下 每个字段对应的权重 ,对于这点小忙我还是很乐意帮的,本片博客就用来记录一下过程。知识补充让我们了解一下熵权法,参考 这篇文章 。熵既然是要根据 熵 来求权重,我们也得知道 熵 是什么。熵 是 统计物理与信息论术语 ,泛指某些 物质系统状态的 一原创 2021-11-19 23:38:54 · 11249 阅读 · 0 评论 -
Python 重写一个提取字符串中行政区划的 Series(下)
Python 重写一个提取字符串中行政区划的 Series(下)创作背景思路分析 - 编写类方法返回一个结果返回 Series 结果结尾创作背景本菜鸡最近在数据分析时遇到这样一列数据,如图我想进行的操作是:提取其中 各行政区划及名称。eg: 江苏省,北京市 这种。目标已达成,详见文章。像 pd.to_datetime() 后可以调用 time_series.dt.year 返回对应的 年序列 一样,我的 area_series 可以返回对应的 省,市,市辖区/县。详见本文。注:本文将 市辖区原创 2021-10-30 21:40:23 · 245 阅读 · 0 评论 -
Python 重写一个提取字符串中行政区划的 Series(上)
Python 写一个提取字符串中行政区划的函数创作背景思路分析提取行政区划eg1:福建省莆田市城厢区eg2:新疆维吾尔自治区乌鲁木齐市eg3:青海省共和县泛化结尾创作背景本菜鸡最近在数据分析时遇到这样一列数据,如图我想进行的操作是:提取其中 各行政区划及名称。eg: 江苏省,北京市 这种。像 pd.to_datetime() 后可以调用 time_series.dt.year 返回对应的 年序列 一样,我的 area_series 可以返回对应的 省,市,市辖区/县。注:本文将 市辖区 和原创 2021-10-30 09:34:24 · 632 阅读 · 0 评论 -
Pandas 报错 Unalignable boolean Series provided as indexer 的解决方法
Pandas 报错 Unalignable boolean Series provided as indexer 的解决方法前言改 bug分析第一步第二步解决我的问题解决方案通用解决方案结尾前言最近本菜鸡在 批量处理 数据的时候出现了问题,场景是:批量获得数据,判断是否在指定 DataFrame 中,如果不在,则 存入,否则,读取 ,但是写好多线程后出现了问题,于是写下本篇文章来记录一下出现问题的原因及解决方法。偷偷说一句:如果对我的文章满意的话可不可以给我 点个赞 , 点个收藏, 点个关注,评论原创 2021-10-13 00:28:21 · 11816 阅读 · 3 评论 -
教你判断一个 DataFrame 中数据是否在另一个 DataFrame 中
教你判断一个 DataFrame 中数据是否在另一个 DataFrame 中创作背景问题分析问题解决结尾创作背景最近本菜鸡在帮别人处理数据,有个需求是 将一个 DataFrame 中在另一个 DataFrame 中的数据除去也就是有两个 DataFrame,A 和 B,B 是 A 与另一个 DataFrame C 取交集的结果,要把 B 中的数据从 A 中删除,有指定的列问题分析这个问题的难点在于:1. B 的列数和 A 不一样2. 遍历 A 中每一行数据3. 判断 A 中的一行数据是原创 2021-08-21 00:33:19 · 7194 阅读 · 6 评论 -
解决 DataFrame 中不是日期格式的数据(异常值)
解决pandas不是日期格式的数据创作背景问题再现数据处理结尾创作背景最近闲来无事,想着巩固一下数据分析的知识,于是就盯上了我的服务器的日志文件,想要分析一下,整个可视化啥的但是,我又碰见了问题问题再现日志嘛,有一列肯定是日期(我的是第一列),我本想根据日期的周进行分类,使用的是 pandas 中的 to_datetime 函数但是,很意外的,竟然报错了错误如下:ValueError:time data >UkJn(9323)</ScRiPt> doesn't ma原创 2021-04-13 23:57:29 · 1166 阅读 · 1 评论 -
删除df.groupby()后某一分组
删除df.groupby后某一分组问题再现解决方法问题再现有一个 DataFrame ,如图所示以字段 序号 作为分组条件,分组后的结果会出现如最后一个分组一样的 异常值想要将异常值删除解决方法以我的数据为例gb_list 为分组后的对象# 获得异常值分组ex = gb_list.get_group('序号')...原创 2021-05-19 10:44:14 · 1836 阅读 · 0 评论