自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (5)
  • 收藏
  • 关注

原创 可一键生成数据分析报告的两个库

小小明 今天要介绍两个一行代码就可以生成数据分析报告的库,分别是sweetviz和pandas_profiling。 首先我们从码云上下载测试数据: import pandas as pd import numpy as np titanic = pd.read_csv("https://gitee.com/hyesc/machine-learning-stu/raw/master/titanic.csv") titanic.head() sweetviz 参考:https://github.co.

2021-03-23 01:50:04 61220 52

原创 结构化数据非等值范围查找问题

本问题数据来源于小z的《解一道反常的Pandas题(附源数据和代码)》 需求如下: 该问题最核心的解题思路是按照地区代码先将两张表关联起来,然后按照重量是否在指定的区间筛选出符合条件的记录。 各类不同的解法实际区别也是,如何进行表关联,如何进行关联后的过滤。大家都习惯性用merge或join进行表关联,而我则习惯直接在循环中定向筛选,我这样做的好处是不会一次性产生全表的笛卡尔积,不会一次性产生N倍的内存浪费。但考虑到实际数据量很小,直接用全表join其实也可以的。 顺序查找匹配 首先读取数据: impor

2021-03-09 09:37:01 40015 51

原创 SQL思维快速上手使用Pandas

大多数数据工作者都学过SQL,却没有学过Pandas,本文的目标是让熟悉SQL语法的朋友能够快速在pandas上使用同样思维的等价方法。 下面测试的过程中,数据库中存在下面三张表,数据库版本为MySQL 8.0.19: (上面使用的数据库可视化工具为SQLyog) 本文涉及的库,可以使用pip安装: pip install sqlalchemy pip install pandas -U pip install pandasql 数据来源: tips.csv:https://raw.github.com

2021-03-08 18:30:12 40226 47

决战Linux到精通.pdf

https://xxmdmst.blog.csdn.net/article/details/120446586这篇文章的PDF版本

2021-09-24

2021年55万条IP地址库

字段说明: StartIPText 起始IP StartIPNum 起始IP数值 EndIPText 结束IP EndIPNum 结束IP数值 Country 国家/地区 Local 本地/地址

2021-07-14

[小小明]Python正则表达式全套笔记v0.3(1.8万字干货).pdf

本文档是小小明个人的学习笔记,涵盖了正则表达式的各个方面,包括各种模式、分组、断言。 正则的匹配、查找、替换和切割一节包含各种典型的实际案例,各类使用场景。 正则匹配规则表,方便我们随时查询正则的规则,即使我自己也无法保证把那些规则全部记住,使用时 需要随时回来查询。 贪婪模式和非贪婪模式部分顺便简单讲解了正则匹配的基本原理(NFA和DFA,在2.3和3.2两个章 节)。 会员阅读地址:https://blog.csdn.net/as604049322/article/details/112691043 作者的博客地址:https://blog.csdn.net/as604049322

2021-01-17

python调用go或c语言.pdf

Python是一个生产力很高的语言,能够以最高的效率完成最多的事,但是Python的性能,是我们一直诟病的一个问题,尤其是一个大锁GIL。当然现在大部分程序都是(IO)网络密集型程序,Python足以胜任,但是如果说我们已经存在的项目或者想要开发的项目中,存在有计算密集型的程序场景,该如何提升性能呢? ​ 一般是可以用C\C++重写Python计算密集的地方,来提高性能,但是C\C++是有一些学习成本的,指针和自己释放内存都有一定门槛。Go就很方便了,自动垃圾自动回收,还有天生高并发等优势。 ​ python的ctypes模块提供了和C语言兼容的数据类型和函数来加载so/dll动态链接

2021-01-01

docxtpl使用手册

一个强大的包docxtpl ,它通过对docx文档模板加载,使用jinja2网页模板开发的语法对其进行修改。 docxtpl 的作者开发出它的原因主要是python-docx擅长创建word文档,却不擅长修改。 对于docxtpl来说,使用MicrosoftWord编辑文档时,直接在文档中插入类似于Jinja2的标记。将文档保存为.docx文件(XML格式):它将是.docx模板文件。 然后使用docxtpl加载这个.docx模板、

2020-12-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除