后端-Python3/Flask/Django
python后端服务
OceanEyes.GZY
算法策略
展开
-
Python数据挖掘——数据预处理
Python数据挖掘——数据预处理数据预处理数据质量准确性、完整性、一致性、时效性、可信性、可解释性数据预处理的主要任务数据清理数据集成数据归约维归约数值归约数据变换规范化数据离散化概念分层产生数据清理(试图填充缺失的值,光滑噪声并识别离群点,纠正数据的不一致)缺失值忽略元组人工填写缺失值使用一个全局常量填充缺失值使用属性的...原创 2020-01-15 09:48:52 · 264 阅读 · 0 评论 -
Python数据挖掘——数据概述
Python数据挖掘——数据概述数据集由数据对象组成;数据的基本统计描述中心趋势度量均值中位数众数中列数数据集的最大值和最小值的平均度量数据分布极差最大值与最小值的差四分位数方差四分位数极差数据基本统计描述的图形显示一元分布分位数图分位数-分位数图(q-q图)直方图二元分布散点图数据可视化1、基于像素...原创 2020-01-15 09:48:11 · 154 阅读 · 0 评论 -
Python数据挖掘——基础知识
Python数据挖掘——基础知识数据挖掘又称从数据中 挖掘知识、知识提取、数据/模式分析即为:从数据中发现知识的过程1、数据清理 (消除噪声,删除不一致数据)2、数据集成 (多种数据源 组合在一起)3、数据选择 (从数据库中提取和分析任务相关的数据)4、数据变换 (通过汇总或聚焦操作,把数据变换和统一成适合挖掘的形式)5、数据挖掘 (基本步骤,使用智能化方法提取数据)6、模式评...原创 2020-01-15 09:47:29 · 272 阅读 · 0 评论 -
Python数据挖掘——概要
一、数据挖掘过程1.数据选择分析业务需求后,选择应用于需求业务相关的数据:业务原始数据、公开的数据集、也可通过爬虫采集网站结构化的数据。明确业务需求并选择好针对性的数据是数据挖掘的先决条件。2.数据预处理通常选择好的数据会有噪音,不完整等缺陷,需要对数据进行清洗,缺失项处理,集成,转换以及归纳:python字符串处理(相当方便)、正则式匹配、pandas、beautifulsoup处理H...转载 2020-01-15 09:46:47 · 315 阅读 · 0 评论 -
08-matplotlib-颜色与样式
import numpy as npimport matplotlib.pyplot as plt''' 颜色: - 八种内置默认颜色, 缩写 b :blue g :green r :red c :cyan m :magenta y :yellow ...原创 2019-03-17 19:12:21 · 783 阅读 · 0 评论 -
07-matplotlib-箱线图
import numpy as npimport matplotlib.pyplot as plt''' 箱形图(Box-plot)又称为盒须图,盒式图,或 箱线图; 是一种用在显示一组数据分散情况的资料统计图; 上边缘,上四分位数,中位数,下四分位数,下边缘,异常值;'''np.random.seed(100)data = np.random.normal...原创 2019-03-17 19:11:06 · 326 阅读 · 0 评论 -
06-matplotlib-饼状图
import numpy as npimport matplotlib.pyplot as plt''' 饼状图显示一个数据系列中各项总和的比例; 饼状图中的数据点显示为整个饼状图的百分比; 如:前十大品牌占市场份额图 '''# 例labels = 'A','B','C','D'fracs = [15.0,30.0,45.0,10.0]explo...原创 2019-03-17 19:09:21 · 116 阅读 · 0 评论 -
05-matplotlib-直方图
import numpy as npimport matplotlib.pyplot as plt''' 由于一系列不等的纵形图组成,表示数据分布的情况 例如:某年级同学的身高分布 需要注意与 柱形图的区别'''# # 例# mu = 100 #均值# sigma = 20 # 标准差## x = mu + sigma * np.rando...原创 2019-03-17 18:49:07 · 261 阅读 · 0 评论 -
04-matplotlib-柱形图
import numpy as npimport matplotlib.pyplot as plt# 柱形图# 例一N =5y = [15,28,10,30,25]index = np.arange(N)p = plt.bar(index,height=y)plt.show()# 例2p1 = plt.bar(0,bottom=index,width=y,height=...原创 2019-03-17 18:46:39 · 247 阅读 · 0 评论 -
03-matplotlib-折线图
import numpy as npimport matplotlib.pyplot as pltimport matplotlib.dates as mdates''' 折线图,用直线段将各数据连接起来组成的图形 常用来观察数据随时间变化的趋势 例如:股票价格,温度变化'''date ,open ,close = np.loadtxt("000001.c...原创 2019-03-17 18:44:45 · 190 阅读 · 0 评论 -
02-matplotlib-散点图
import numpy as npimport matplotlib.pyplot as plt''' 散点图显示两组数据的值,每个点的坐标位置的值决定 用户观察两种变量的相关性: 正相关 负相关 不相关 '''# 正相关height = [161,170,174,165,182,175]weigh...原创 2019-03-17 18:42:18 · 170 阅读 · 0 评论 -
01-numpy基础简介
import numpy as np # ndarray ''' # 三种创建方式 1、从python的基础数据对象转化 2、通过numpy内置的函数生成 3、从硬盘(文件)读取数据 ''' # 创建方法一 a= [1,2,3,4] x1 = np.arra...原创 2019-03-17 18:38:21 · 231 阅读 · 0 评论 -
11-matplotlib-多图
#!/usr/bin/python# -*- coding:utf-8 -*-import numpy as npimport matplotlib.pyplot as plt# 通过创建多个figure 对象来创建多图fig1 = plt.figure()ax1 = fig1.add_subplot(111)ax1.plot([1,2,3],[3,2,1])fig2 = ...原创 2019-03-19 21:56:39 · 100 阅读 · 0 评论 -
10-matplotlib-子图
#!/usr/bin/python# -*- coding:utf-8 -*-import numpy as npimport matplotlib.pyplot as plt''' - matplotlib 对象简介 FigureCanvas Figure Axes - figure = plt.figure() ...原创 2019-03-19 21:39:35 · 124 阅读 · 0 评论 -
09-matplotlib-面向对象
#!/usr/bin/python# -*- coding:utf-8 -*-import numpy as npimport matplotlib.pyplot as plt''' 三种方式简介 - pyplot : 经典高层封闭 - pylab : 将matplotlib 和 numpy 合并的模块, 模拟matlab的编程环境 ...原创 2019-03-19 21:32:03 · 562 阅读 · 0 评论 -
CentOS7编译安装Python3.7
安装编译工具 yum -y groupinstall "Development tools" yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpcap-devel xz-devel yum...原创 2019-02-26 20:34:54 · 621 阅读 · 0 评论 -
几行代码教你OCR的正确姿势
什么是OCR?我们来看一下百度百科给的定义:OCR (Optical CharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;我简要的总结为: OCR三步走:"内容——> 扫描——>结果"今天来用代码的形式讲一下,怎么用...原创 2019-02-28 16:28:49 · 2475 阅读 · 0 评论