Python基础
文章平均质量分 92
python的基础操作
DataMiningSharer
毕业于华中科技大学,专注于数据挖掘基础、流程和案例分享。
展开
-
【数据分析】用六千字来解释文科生怎么理解机器学习数据挖掘
从人类学习说起回顾人类从亿万年前诞生至今,文明从无到有、从有到高度发达,当然如今的文明是否高度发达还存疑,但是不可否认的是与原始人类只会使用简单工具相比,我们的科技文明已经大大扩展了人类的想象力。原创 2022-02-22 21:05:10 · 701 阅读 · 0 评论 -
如何用Python操作Excel自动化办公?一个案例教会你openpyxl——图表设计和透视表
毫无疑问Excel是最便捷高效的可视化工具,它可以满足基本的日常工作中的图表需求。在openpyxl中也可以设置表格样式和画图表,基本上Excel里自带的表格样式和图表类型都覆盖了,在前三篇Excel读写、公式计算、格式设置内容的基础上,本篇来讲解一下如何设置表格样式和插入图表。一、表格样式 也许大家使用Excel表格是原创 2022-02-22 20:45:45 · 4124 阅读 · 0 评论 -
如何用Python操作Excel自动化办公?一个案例教会你openpyxl——样式和条件格式
虽然现在各种各样强大的工具很多,但是人人都离不开Excel,原因就在于简单易用、快捷DIY。它不仅是CRUD(增删改查)的工具,也是可视化设计便利的工具。日常工作中,除了基本的数据处理,还需要对Excel表格、单元格、图表进行格式整理、样式美化,便于直观明确的传达信息。本篇接着上两篇讲解如何让通过openpyxl进行单元格合并、边框、字体、颜色、行高列宽、对齐等功能。原创 2022-02-22 20:44:11 · 2777 阅读 · 0 评论 -
如何用Python操作Excel自动化办公?一个案例教会你openpyxl——公式计算和数据处理
术业有专攻,每一种工具每一种岗位都会有资深玩家,别说因为人人都会Excel就瞧不起Excel玩的溜的朋友。对于运营场景来说,能够和具体业务结合紧密,轻松实现目的,这就是很强大的玩家,但是如果精于提高技能水准来说,可能需要扩大技术的应用场景,强调通用性。openpyxl等Python辅助办公工具就是在Excel基础上提升效率而产生原创 2022-02-07 21:11:56 · 4299 阅读 · 2 评论 -
如何用Python操作Excel自动化办公?一个案例教会你openpyxl——读取数据
数据分析工作最难搞的是处理数据的过程,不然不会有专门的ETL(数据抽取、转换、加载)工程师了。如果是企业级数据处理可能数据库直接搞定。不过对于日常办公人士来说就会有点麻烦,常常需要处理各种CSV/Excel表格。如果数据量比较小、一次性事务处理的话,手动处理Excel表格就好,用程序或软件的话反而比较麻烦。但是如果数据原创 2022-02-06 15:32:32 · 3328 阅读 · 0 评论 -
如何对Excel列快速移动或对调?四种方法给你一点解决问题的灵感
工作中遇到关于excel的一个小小的问题,如下有32行71列数据,现在需要对71个列进行对调,如果是你,你会怎么解决?如果一列一列拖动,可以解决问题但是工作量大容易出错,所以得想个简便的方法。因为列标题恰好是日期,可以通过排序的方式对调,不过好像只有行排序,没有对列进行排序的功能菜单。那怎么办呢?原创 2022-02-05 22:17:09 · 2698 阅读 · 0 评论 -
1001系列之案例0004如何从餐厅订单数据中挖掘有效信息
本案例主要在于使用pandas的分组聚合函数和日期时间函数做简单分析。import os #导入必要的库import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarnings.filterwarnings("ignore")os.chdir("D:\Data\File") #指定工作目原创 2021-05-26 15:39:12 · 701 阅读 · 0 评论 -
1001系列之案例0003如何对欧洲人口普查数据集整理挖掘
一、欧洲人口普查数据分析本案例重点在于对数据质量的清洗、转换,、可视化。import os #导入需要的库import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings("ignore")os.chdir(r"D:\Datalu\File") #指定工作目录%matplotlib inline原创 2021-05-26 08:34:35 · 528 阅读 · 1 评论 -
1001系列之案例0002如何从斯德哥尔摩气温数据集中可视化挖掘
本案例的重点在于Matplotlib可视化的基础操作实战练习。import os #导入必要的库import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport warningswarnings.filterwarnings("ignore")os.chdir("D:\Datalu\File") #指定工作目录%matplotlib inline .原创 2021-05-25 22:52:47 · 486 阅读 · 2 评论 -
1001系列之案例0001如何从淘宝销售数据集中挖掘有效信息
一、淘宝数据集挖掘本案例重点有二:重点一在于如何修改数据类型以降低内存占用,这对大数据非常重要;重点二在于分析变量之间的关系,单变量分布,双变量相关或方差分析,多变量回归或分类;#导入必要的库import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarnings.filterwarnings("ignore")#指定工作路径以导入数原创 2021-05-25 17:43:07 · 479 阅读 · 0 评论 -
1001系列之pandas0002如何从CSV&text files文件中导入导出数据
一、pd.read_csv()模块简介数据挖掘任务的数据源不仅来自数据库,也可能来自已经整理好的表格等结构化数据和网页等非结构化数据。本节内容主要讲如何从CSV等text file中导入数据。当任务需求不同时,可以定制导入到Python中的数据,甚至当数据量过大时,还需要考虑分批导入或者转换数据类型以减少占用内存空间。#导入pandas库import pandas as pdimport numpy as npfrom io import StringIO二、pd.read_csv()的参数原创 2021-05-18 19:05:19 · 248 阅读 · 0 评论 -
1001系列之pandas0001如何从Mysql数据库中导入导出数据
一、Pymysql模块简介 Mysql数据库是数据挖掘任务的数据源之一,通过pymysql模块可以直接连接MySQL数据库,进行增删改查等操作。Python连接MySQL的流程如下:1.1cursor(游标)的作用 为什么要建立一个cursor(游标)? 因为当python与数据库连接时并不是一次性读取了所有数据,而是根据SQL语言进行操作。cursor在这里相当于执行SQL查询的货车,在Mysql数据库和Python程序之间传递信息。二、实际操作连接数据库2.1 导原创 2021-05-18 10:20:40 · 691 阅读 · 0 评论