自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

捡垃圾的朵

统计学日常学习总结

  • 博客(16)
  • 收藏
  • 关注

原创 6种常见的数据预处理方法

属性具有多种类型,包括效益型、成本型、区间型、中间型等。这四种属性,效益型属性越大越好,成本型属性越小越好,区间型属性是在某个区间最佳,中间型是越接近某个数越好。(3)归一化:属性值表中不同指标的属性值的数值大小差别很大,为了直观,需要把属性值表中的数值归一化,即把表中数值均变换到[0,1]区间上。(1)指标正向化处理:属性值有多种类型,为了便于处理,可以进行极大化处理,使得表中任一属性下性能越优的方案变换后的属性值越大。(2)无量纲化:每一列数值具有不同的单位(量纲),可以对每个指标进行无量纲化。

2024-05-25 00:12:06 367

原创 评价模型-灰色关联分析

关联度:关联度是因素(指标)之间关联性大小的度量,它定量地描述了因素之间相对变化的情况。从思路上看,关联度分析属于几何处理范畴。基本思想是根据序列曲线集合形状的相似程度来判断其联系是否紧密,即认为几何形状越接近,关联程度越大。因此,利用灰色关联度可对评价对象的优劣进行比较分析。理解关联度的例子:在以上的例子中,如果把总收入看作参考序列,把招商引资和农业收入就是被比较的对象。①招商引资和总收入(参考序列)变化趋势很相似;②农业收入和总收入(参考序列)变化趋势不太相似;

2024-05-13 13:30:19 827

原创 线性规划问题——基于Python

【代码】线性规划问题——基于Python。

2023-05-31 14:50:05 179

原创 线性代数相关知识(矩阵)——基于Python

【代码】线性代数相关知识(矩阵)——基于Python。

2023-05-30 23:11:27 140

原创 Python入门——程序的组织结构

@爱学习的朵目录1 顺序结构2 对象的布尔值3 选择结构(if)3.1 单分支结构(if)3.2 双分支结构(if...else...)(2选1执行)3.3 多分支结构(多选1执行)3.4 分支的嵌套4 循环结构(while、for in)1 顺序结构2 对象的布尔值Python一切皆对象,所有对象都有一个布尔值。以下对象的布尔值为False。(1)False(2)数值0(3)None(4)空字符串(5)空列表(6)空元组(7)空字典(8)空集合其他对象的布尔值均为True。

2022-05-03 10:43:29 143

原创 python入门——input函数、运算符

@爱学习的朵目录1 input函数2 运算符2.1 算数运算符2.1.1 标准算数运算符2.1.2 取余运算符2.1.3 幂运算符2.2 赋值运算符(顺序:从右到左)2.2.2 链式赋值2.2.2 参数赋值2.2.3 系列解包赋值2.3 比较运算符(结果为布尔类型)2.3.1 > 和<和 >= 和<= 和!=2.3.2 对象value的比较2.3.4 对象id的比较2.4 布尔运算符2.4.1 and2.4.2 or2.4.3 not(对布尔类型取反)2.4.4 in和not i

2022-05-02 22:01:00 1605

原创 Python入门——print函数、转义字符、数据类型介绍

@ 爱学习的DUO目录1 print()函数1.1 输出到控制台1.1.1 输出数字1.1.2 输出字符串1.1.3 输出表达式1.2 输出到文件中2 转义字符2.1 换行字符 \n2.2 tab字符 \t3 查看python的key words4 常见数据类型4.1 整数型 int4.2 浮点型 float4.3 布尔型(True、False)4.4 字符串型 str1 print()函数1.1 输出到控制台1.1.1 输出数字print(520) #5201.1.2 输出字符串prin

2022-05-02 19:42:58 969

原创 【Python】——筛选存在空值的行or非空值的行

@ 爱学习的阿朵1 数据说明import pandas as pdtest = pd.read_excel('D:/pp/test_null.xlsx','Sheet1');testnote:① NaN:not a number② NaT:not a time2 筛选【有空值】的行2.1 任意列有空值的行test[test.isnull().T.any()] #无论哪列,有空值的被选出来2.2 指定列有空值的行例1:只筛选【生日】列存在空值的行。test[test[['生日

2022-04-30 09:50:09 10879

原创 【Python】——concat函数

@爱学习的DUO目录1 数据说明2 纵向拼接(默认)3 横向拼接4 总结语法:result = pd.concat([df1, df2], axis= ‘ ')①axis=0,纵向拼接(默认)②axis=1,横向拼接1 数据说明import pandas as pddf1 = pd.DataFrame({'Name':['张三','李四','王五'], 'Age':[25,26,27]})df2 = pd.DataFrame({'Name':['大六'],'Age':[30]})df

2022-04-29 21:20:31 45145

原创 【python】———merge函数

@爱学习的DUO目录1 数据读取(A、B表)2 当右表无重复项3 当右表有重复项3.1 数据读取(C表)3.2 不对右表去重3.3 对右表去重处理3.4 总结merge()表示将【左表】和【右表】,按某个均有的字段,进行横向匹配。1 数据读取(A、B表)import pandas as pdA = pd.read_excel('D:/pp/test.xlsx','Sheet1');AB = pd.read_excel('D:/pp/test.xlsx','Sheet2');BA表(左)

2022-04-29 19:05:57 19002 2

原创 trunc()

@爱学习的阿朵目录1、trunc()截断函数1.1 trunc()截断数字1.2 trunc()截断日期2、to_char()函数3、to_date1、trunc()截断函数含义:① trunc(number)表示截断数字② trunc(date)表示截断日期1.1 trunc()截断数字select TRUNC(15.79,1) from dual; --15.7,保留小数点后一位select TRUNC(15.123456789,2) from dual; --15.12,保留小数点

2022-04-26 14:38:42 1804

原创 SQL的join和left join

@爱学习的阿朵目录1、数据说明1.1 websites表(5行)1.2 access_log表(9行)2、join...on 的用法3、left join的用法3.1 当左表为websites(5行),右表为access_log(9行)3.2 当左表为access_log(9行),右表为websites(5行)4、group by回顾1、数据说明用到了菜鸟教程里的2个表:websites和access_log。两表信息如下图所示。表的创建:drop table websitescreate

2022-04-26 11:38:42 3114

原创 2、SQL学习:排序查询and分组查询

@爱学习的DUO目录第三章 查询语言3.3 排序查询3.3.1 排序查询案例3.3.2 排序查询总结3.4 常见函数3.4.1 单行函数3.4.1.1 字符函数3.4.1.2 数学函数3.4.1.3 日期函数3.4.1.4 流程控制函数3.4.2 聚合函数/分组函数3.4.2.1 sum函数3.4.2.2 avg函数3.4.2.3 count函数3.4.3 分组函数和distinct使用3.5 分组查询(group by)3.5.1 分组前查询(单个字段)3.5.2 分组后查询3.5.3 按表达式或函数

2022-04-23 23:26:28 745

原创 1、SQL学习:基础查询and条件查询

@爱学习的DUO目录第一章:数据库查看第二章 :常用的命令第三章:查询语言3.1 基础查询3.1.1 查询表中的单个字段3.1.2 查询表中的多个字段3.1.3 查询表中的所有字段3.1.4 查询常量值3.1.5 查询表达式3.1.6 查询函数3.1.7 起别名3.1.8 去重3.1.9 CONCAT()连接符3.1.10 ifnull()3.2 条件查询3.2.1 按条件表达式3.2.2 按逻辑表达式筛选(连接条件表达式)3.2.3 模糊查询总结第一章:数据库查看note:采用myemployee库

2022-04-23 10:11:58 1326

原创 Python机器学习——1 监督学习(1.1-1.3 数据的预处理and编码)

Python机器学习——1 监督学习1.1 简介监督学习:监督学习是值在有标记的样本(labeled sample)上建立机器学习的模型。无监督学习:面对的是没有标记的数据,假设需要把一些数据分成不同的组别,但是对分组条件毫不知情。1.2 数据预处理计数在实际中,原始数据通常是计算机无法理解的,所以要对原始数据进行预处理.1.2.1 准备工作导入程序包and数组:imp...

2020-04-07 21:55:15 245

原创 R语言的三大绘图系统

title: “R的三大绘图系统”author: “DUO”date: “2020/3/19”output:html_document:toc: yes<>三大绘图系统简介基本绘图系统–2DLattice绘图系统——使用一次函数调用(一次成图)ggplot2绘图系统–数据映射到几何客体1.1基本绘图系统绘图函数(graphics包)——plot/hist/...

2020-03-19 14:04:15 732

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除