统计
数理统计知识
嚯嚯嚯嚯什么都不会
这个作者很懒,什么都没留下…
展开
-
如何进行用户画像分析
引领下半场发展的大数据 ,将赋能政府智慧管理交通、城市规划;通过消费者数据,告诉企业该生产什么样的数据,最大化满足消费者,生活大数据告诉餐饮、房地产企业选址等;互联网下半场考虑精细化运营 ,通过数据分析让用户得到更好的体验。背景——分析下用户数据,为业务数据赋能;用户画像的准则(用户画像的建模)将自己的企业数据进行一个白描。知道用户都是谁,从哪里来,到哪里去;1知道用户从哪里来,需要统一标识用户ID,以便对用户进行后续跟踪;知道用户是谁,需要对用户进行标签化,,方便对用户行为进行理解用原创 2020-12-01 23:14:38 · 1125 阅读 · 0 评论 -
数理统计——朴素贝叶斯分类
文章目录前言一、概念二、使用步骤1.引入库2.朴素贝叶斯算法2.常用朴素贝叶斯极客时间:1.常用概念2.朴素贝叶斯分类器工作流程3.如何使用朴素贝叶斯分类对文档进行分类前言一、概念熟悉条件概率、联合概率、独立性概率熟悉全概率公式与贝叶斯公式清楚朴素贝叶斯算法原理能使用该算法实现分类任务二、使用步骤1.引入库随机事件概率联合概率:多个事件同时发生的概率条件概率:在事件A发生的前提下,B事件发生的概率。独立性现象独立性定义全概率公式贝叶斯公式:其核心思维是将求解p(A|B)原创 2020-11-22 03:20:14 · 593 阅读 · 0 评论 -
数理统计——KNN分类与预测
文章目录前言一、相关概念1.算法原理2.算法超参数3.算法步骤4.距离如何度量?5.KD树6.权重计算方式二、使用KNN实现分类前言学习KNN算法的原理;超参数调整;KNN算法的应用;一、相关概念先来看一个例子:import numpy as np import matplotlib.pyplot as pltplt.rcParams["font.family"]="SimHei"plt.rcParams["axes.unicode_minus"]=Falseplt.rcParam原创 2020-11-21 15:34:24 · 3716 阅读 · 0 评论 -
数理统计——逻辑回归与python实现鸢尾花二分类
文章目录前言一、逻辑回归模型1.1模型简介1.2 算法的分类思想1.3sigmoid函数1.4逻辑回归损失函数二.逻辑回归实现二分类2.1模型训练与预测2.2计算概率2.3绘制决策边界三、逻辑回归实现多分类前言本篇主要学习逻辑回归模型,使用逻辑回归实现分类任务 。目标:能够清晰理解逻辑回归模型的原理。能够掌握sigmoid函数的作用。能够使用逻辑回归模型实现二分类以及多分类任务。一、逻辑回归模型1.1模型简介逻辑回归实际上是一个分类算法,其应用于对一个样本数据进行分类的场景中。通过给定的数原创 2020-11-20 23:41:48 · 5225 阅读 · 0 评论 -
数理统计——AQI预测
文章目录前言一、对空气质量进行预测1.1数据转换1.2 基模型1.3特征选择1.4异常值的处理1.5残差图的分析前言本节主要对AQI进行预测,并学习相关知识点。一、对空气质量进行预测1.1数据转换在预测之前,再次查看数据是否清洗到位,并对不符合建模要求的数据进行转换,在此次数据集中,需要将离散变量转换成离散变量。#1、数据读取#导入相关库import numpy as np import pandas as pd import matplotlib.pyplot as pltimpor原创 2020-11-20 04:22:44 · 1974 阅读 · 1 评论 -
数理统计——AQI分析
文章目录一、AQI分析与预测1.1 背景信息1.2 分析目标/任务1.3 数据集概览二、数据分析流程2.1基本流程2.2理解流程三、读取数据3.1导入相关的库3.2加载数据集四、数据清洗4.1缺失值4.2异常值4.3重复值五、数据分析5.1哪些城市的空气质量较好/较差【描述性统计分析】5.2全国城市空气质量【描述性统计】5.3临海城市的空气质量是否有别于内陆城市【推断性统计分析】5.4空气质量受那些因素的影响【相关系数分析】5.5全国空气质量普遍处于何种水平【区间估计】5.6对城市空气质量进行预测一、AQ原创 2020-11-19 23:04:20 · 1767 阅读 · 0 评论 -
数理统计——线性回归与python实现
文章目录前言一、重要概念1.模型2.回归分析3.简单线性回归4.拟合5.多元线性回归6.损失函数7.参数求解二、一元线性回归模型代码实现1.简单线性回归程序三、回归模型评估1.MSE2.RMSE3.MAE4.R方四、多元线性回归模型代码实现五、作业前言本节知识点:学习线性回归模型,实现连续变量类型的预测。1、掌握线性回归的原理;2、能够实用线性回归进行预测;3、能够对线性回归模型进行预测;一、重要概念1.模型2.回归分析3.简单线性回归4.拟合5.多元线性回归6.损失函数用来衡量误原创 2020-11-19 15:20:16 · 523 阅读 · 1 评论 -
数理统计——推断统计假设检验与python实现
文章目录前言一、假设检验是什么?1.概念2.假设检验的步骤二、常用假设检验1.Z检验2.t检验3.双边检验与单边检验作业前言一台机器包装糖,袋里的糖是一个随机变量,服从正态分布,当机器正常时,其均值为0.5kg,标准差为0.015kg,某天开工后检查机器包装是否正常,随机抽取了下面9袋(0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512),问机器是否正常?如果采用区间估计的思想,其思路和代码实现如下:1、计算出9袋糖的均值、标准误差;2、计原创 2020-11-19 06:07:14 · 592 阅读 · 0 评论 -
数理统计——推断统计参数估计与python实现
文章目录前言一、基本概念1.总体、样本、个体(略)2.点估计、区间估计3.推断统计概念二、代码实现1.点估计2.区间估计三、作业前言本节知识要点:推断统计分析——参数估计目标:熟知点估计与区间估计中心极限定理正态分布及其特性python实现与分析思路是重点一、基本概念1.总体、样本、个体(略)2.点估计、区间估计3.推断统计概念推断统计即用样本的数据去推断总体数量的特征,是以概率形式进行推断的,因为总体往往是未知的。二、代码实现1.点估计使用鸢尾花样本长度的均值来估计总体鸢尾花原创 2020-11-19 02:48:24 · 450 阅读 · 0 评论 -
数理统计——描述统计与Python实现
文章目录前言一、描述性统计是什么?1.统计量2.变量的类型二、各统计量与python实操1.频数与频率2.集中趋势3.四分位值4.离散趋势5.分布形态(和偏度相关)5.分布形态(和峰度相关)作业:前言本节知识要点与目标:1、熟知描述性统计常用的统计量2、清晰认知各统计量的含义和应用3、能用Python实现,应用于数据分析中一、描述性统计是什么?从总体数据中提取变量的主要信息(总和,均值等)。从总体的层面上对数据进行统计描述,在统计过程中经常会配合绘制一些相关统计图来辅助。1.统计量统计量,原创 2020-11-19 00:18:34 · 1140 阅读 · 1 评论 -
小笨蛋学习Python第八集
文章目录前言一、pandas是什么?二、series对象2.1Series常用操作2.2.series进行算术运算操作三、DataFrame的创建3.1.DataFrame的创建3.2.DataFrame的对象常用属性前言Python基础知识8本节主要学习pandas相关知识点一、pandas是什么?pandas是基于numpy的一种工具,能使我们快速便捷地处理数据的函数和方法。其纳入了很多库和标准的数据模型。二、series对象series是Pandas中最基本的对象,类似于一维数组,和n原创 2020-11-17 23:56:04 · 207 阅读 · 0 评论 -
小笨蛋学习Python7第七集
文章目录python基础知识7一、munpy是什么?二、numpy的优势二、Numpy的Ndarray对象2.1创建一维数组2.2创建二维数组2.3常用属性2.4调整数组的形状2.5将数组转换成列表三、Numpy的数据类型四、数组的计算4.1数组和数的计算4.2数组和数组之间的操作五、数组中的轴5.1数组中的轴六、数组的索引和切片6.1一维数组的操作方法6.2多维数组的操作方法七、数组中的数值修改八、数组添加、删除和去重8.1数组的添加python基础知识7本节主要学习numpy的相关知识。一、mu原创 2020-11-17 02:30:38 · 170 阅读 · 0 评论 -
小笨蛋学习Python6第六集
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录python基础知识6一、matplotlib是什么?二、常见图形种类以及意义1.折线图:2.散点图:3.柱状图:4.直方图:5.饼图:三、matplotlib的简单实现四、对matplotlib图像结构的认识五、折线图1.折线图的绘制:2.设置折线的颜色和形状3.设置折点样式4.设置图片的大小和保存5.设置x轴和y轴的刻度6.设置显示中文7.一图多线7.1拓展一(一图多个坐标子系图)7.2拓展二(设置坐标范围)7.3拓展三(改变坐原创 2020-11-16 01:31:43 · 226 阅读 · 0 评论 -
小笨蛋学习python第五集
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、异常捕获2.模块3.文件的基本操作前言本节知识要点:捕获异常、模块、包、文件的读写等。一、异常捕获高级语言通常都有内置一套try……except……finally……的错误处理机制。try: print("try……") r=10/0 print("result:",r)except ZeroDivisionError as e: print("except:",e)fina原创 2020-11-15 02:26:42 · 69 阅读 · 0 评论 -
小笨蛋学习python第四集
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录(4)Python基础知识篇一、面向对象编程二、类和对象1.类2.对象3.对象与类的关系4.定义类和创建对象5.对象的属性和方法总结(4)Python基础知识篇本节知识要点:学习Python中面向对象的思想一、面向对象编程面向对象编程:Obiect Oriented Programming,简称OOP,是一种程序设计思想,OOP把对象当做程序的基本单元,一个对象包含了数据和操作数据的函数。面向过程编程:把计算机程序视为一原创 2020-11-14 22:55:27 · 195 阅读 · 0 评论 -
小笨蛋学习Python第三集
(3)python基础知识篇本节知识要点:函数的简介函数定义函数的调用函数的文档说明函数的参数位置参数默认参数可变参数关键字参数命名关键字参数参数的组合函数返回值递归函数局部变量全局变量一、函数的简介**(1)、函数:**在开发程序中,经常会遇到需要使用某块代码多次,这时为了提高编写的效率以及代码重用,所以把具有独立功能的代码组织为一个模块,这就是代数,类似与数学上的公式。用的时候直接调出来即可。Python有许多的内建函数,例如print(),我们也可以自己创建函数,这原创 2020-11-14 01:14:51 · 126 阅读 · 0 评论 -
小笨蛋学习python第二集
(2)Python基础知识篇数据类型:一、字符串(str)1、定义:单引号、双引号、三引号包围起来的字符组,例如下面这些:#字符串name="zs"my_gender='female'print("""hello world""")2、下标:下标就是编号的意思,类似于电影院的编号。在Python中经常需要用下标来找到对应的元素。注意:下标索引从0开始,而不是1开始,所以想要取第一个元素,需要取0下标。例如想要取到名字Bonnie里面的B:name='Bonnie'print(name[原创 2020-11-13 14:05:09 · 115 阅读 · 0 评论 -
小笨蛋学习Python第一集
(1)Python基础知识篇本节知识点:注释变量关键字数据类型的转换输入输出格式化符号if条件判断语句运算符循环与遍历break和continue作业:1、从键盘输入一个整数,判断该数字能否被2和3同时整除,能否被2整除,能否被3整除,不能被2和3整除。输出相应信息2、实现用户输入用户名和密码,当用户名为 seven且密码为123时,显示登陆成功,否则登陆失败,失败时允许重复输入三次。3、使用for循环和 range实现输出1-2+3-4+5-6….99的和。4、使用 for原创 2020-11-12 23:37:23 · 393 阅读 · 0 评论