- 博客(3)
- 资源 (5)
- 收藏
- 关注
原创 可一键生成数据分析报告的两个库
小小明 今天要介绍两个一行代码就可以生成数据分析报告的库,分别是sweetviz和pandas_profiling。 首先我们从码云上下载测试数据: import pandas as pd import numpy as np titanic = pd.read_csv("https://gitee.com/hyesc/machine-learning-stu/raw/master/titanic.csv") titanic.head() sweetviz 参考:https://github.co.
2021-03-23 01:50:04 61220 52
原创 结构化数据非等值范围查找问题
本问题数据来源于小z的《解一道反常的Pandas题(附源数据和代码)》 需求如下: 该问题最核心的解题思路是按照地区代码先将两张表关联起来,然后按照重量是否在指定的区间筛选出符合条件的记录。 各类不同的解法实际区别也是,如何进行表关联,如何进行关联后的过滤。大家都习惯性用merge或join进行表关联,而我则习惯直接在循环中定向筛选,我这样做的好处是不会一次性产生全表的笛卡尔积,不会一次性产生N倍的内存浪费。但考虑到实际数据量很小,直接用全表join其实也可以的。 顺序查找匹配 首先读取数据: impor
2021-03-09 09:37:01 40015 51
原创 SQL思维快速上手使用Pandas
大多数数据工作者都学过SQL,却没有学过Pandas,本文的目标是让熟悉SQL语法的朋友能够快速在pandas上使用同样思维的等价方法。 下面测试的过程中,数据库中存在下面三张表,数据库版本为MySQL 8.0.19: (上面使用的数据库可视化工具为SQLyog) 本文涉及的库,可以使用pip安装: pip install sqlalchemy pip install pandas -U pip install pandasql 数据来源: tips.csv:https://raw.github.com
2021-03-08 18:30:12 40226 47
2021年55万条IP地址库
2021-07-14
[小小明]Python正则表达式全套笔记v0.3(1.8万字干货).pdf
2021-01-17
python调用go或c语言.pdf
2021-01-01
docxtpl使用手册
2020-12-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人