自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一个人的博客

记录小垃圾的学习

  • 博客(42)
  • 收藏
  • 关注

原创 机器学习10——电影案例分析

import numpy as npimport pandas as pdimport matplotlib.pyplot as plt1 问题一想要知道电影数据中某些数据的均值等In [24]:movie = pd.read_csv("./data/IMDB-Movie-Data.csv")In [25]:movie.head()Out[25]:RankTitleGenreDescriptionDirectorActorsYearRuntime (Min

2021-10-07 16:09:04 676

原创 机器学习8:——Pandas——8:高级处理5:分组与聚合

一.高级处理-分组与聚合学习目标目标应用groupby和聚合函数实现数据的分组与聚合应用星巴克零售店数据的分组与聚合分组与聚合通常是分析数据的一种方式,通常与一些统计函数一起使用,查看数据的分组情况想一想其实刚才的交叉表与透视表也有分组的功能,所以算是分组的一种形式,只不过他们主要是计算次数或者计算比例!!看其中的效果:1 什么是分组与聚合2 分组APIDataFrame.groupby(key, as_index=False)key:分组的列数据,可以多个

2021-09-26 22:11:23 312

原创 机器学习7:——Pandas——7:高级处理4:交叉表和透视表

一.高级处理-交叉表与透视表学习目标目标应用crosstab和pivot_table实现交叉表与透视表应用股票的每日涨跌跟星期几关系大1 交叉表与透视表什么作用探究股票的涨跌与星期几有关?以下图当中表示,week代表星期几,1,0代表这一天股票的涨跌幅是好还是坏,里面的数据代表比例可以理解为所有时间为星期一等等的数据当中涨跌幅好坏的比例2 使用crosstab(交叉表)实现上图交叉表:交叉表用于计算一列数据对于另外一列数据的分组个数(寻找两个列之间的关系)

2021-09-26 21:30:21 310

原创 机器学习6:——Pandas——6:高级处理3:数据合并

一.高级处理-合并学习目标目标应用pd.concat实现数据的合并应用pd.merge实现数据的合并应用无如果你的数据由多张表组成,那么有时候需要将不同的内容合并在一起分析**1 pd.concat实现数据合并pd.concat([data1, data2], axis=1)按照行或列进行合并,axis=0为列索引,axis=1为行索引比如我们将刚才处理好的one-hot编码与原数据合并[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(

2021-09-26 17:45:07 504

原创 机器学习5:——Pandas——5:高级处理2:数据离散化处理

一.高级处理——数据离散化学习目标目标应用cut、qcut实现数据的区间分组应用get_dummies实现数据的one-hot编码应用找出股票的涨跌幅异动(异常)值1 为什么要离散化连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具。2 什么是数据的离散化连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值。离散化有很多种方法,

2021-09-26 16:31:46 318

原创 机器学习4:——Pandas——4:高级处理1:缺失值处理

1 缺失值处理In [3]:movie = pd.read_csv("./data/IMDB-Movie-Data.csv")In [4]:movieOut[4]:RankTitleGenreDescriptionDirectorActorsYearRuntime (Minutes)RatingVotesRevenue (Millions)Metascore01Guardians of the GalaxyAction,Adventure,Sc

2021-09-26 09:47:13 366

原创 机器学习3:——Pandas——3:文件读取和存储

一.文件读取与存储学习目标目标了解Pandas的几种文件读取存储操作应用CSV方式和HDF方式实现文件的读取和存储应用实现股票数据的读取存储我们的数据大部分存在于文件当中,所以pandas会支持复杂的IO操作,pandas的API支持众多的文件格式,如CSV、SQL、XLS、JSON、HDF5。注:最常用的HDF5和CSV文件[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-417J5Wkb-1632584576844)(…/images/

2021-09-25 23:58:02 708

原创 机器学习2:——Pandas——2:DataFrame运算

5.3 DataFrame运算学习目标目标使用describe完成综合统计使用max完成最大值计算使用min完成最小值计算使用mean完成平均值计算使用std完成标准差计算使用idxmin、idxmax完成最大值最小值的索引使用cumsum等实现累计分析应用逻辑运算符号实现数据的逻辑筛选应用isin实现数据的筛选应用query实现数据的筛选应用add等实现数据间的加法运算应用apply函数实现数据的自定义处理应用股票每日数据的统计1 算术运算add(o

2021-09-25 23:37:02 258

原创 机器学习1:——Pandas——1:基本数据操作

一.基本数据操作学习目标目标记忆DataFrame的形状、行列索引名称获取等基本属性应用Series和DataFrame的索引进行切片获取应用sort_index和sort_values实现索引和值的排序应用股票每日数据的操作为了更好的理解这些基本操作,我们将读取一个真实的股票数据。关于文件操作,后面在介绍,这里只先用一下API# 读取文件data = pd.read_csv("./data/stock_day.csv")# 删除一些列,让数据更简单些,再去做后面的

2021-09-25 23:11:58 320

原创 对《基于机器学习的区域滑坡危险性评价方法综述》阅读的总结

对《基于机器学习的区域滑坡危险性评价方法综述》阅读的总结1.摘要​ 这篇综述主要系统阐述了:作者通过阅读文献,总结了基于机器学习技术解决滑坡危险性评价方法;可以分为 1、评价因子选择 2、数据清洗与样本集构建 3、模型选取与训练评价 这三个关键环节对现有研究成果进行分析评述;最后对机器学习滑坡危险性评价方法的发展趋势提出讨论意见。2.研究背景​ 由于我国国土面积体量大,地形地貌种类繁多,所以相应的滑坡灾害影响范围广。因此可以通过一些方法对区域滑坡危险性进行评估,进而划分轻重缓急区别对待。​

2021-09-11 12:59:18 1744 1

转载 22.Python——面向对象基础(类,对象,魔法方法)

摘要理解面向对象类和对象添加和获取对象属性魔法方法一. 理解面向对象面向对象是一种抽象化的编程思想,很多编程语言中都有的一种思想。例如:洗衣服思考:几种途径可以完成洗衣服?答: 手洗 和 机洗。手洗:找盆 - 放水 - 加洗衣粉 - 浸泡 - 搓洗 - 拧干水 - 倒水 - 漂洗N次 - 拧干 - 晾晒。机洗:打开洗衣机 - 放衣服 - 加洗衣粉 - 按下开始按钮 - 晾晒。思考:对比两种洗衣服途径,同学们发现了什么?答:机洗更简单思考:机洗,只需要找到一台洗衣机,加入简单操

2021-09-11 07:49:20 115

转载 21.Python——文件操作

摘要文件操作的作用文件的基本操作打开读写关闭文件备份文件和文件夹的操作一. 文件操作的作用思考:什么是文件?思考:文件操作包含什么?答:打开、关闭、读、写、复制…思考:文件操作的的作用是什么?答:读取内容、写入内容、备份内容…总结:文件操作的作用就是把一些内容(数据)存储存放起来,可以让程序下一次执行的时候直接使用,而不必重新制作一份,省时省力。二. 文件的基本操作2.1 文件操作步骤打开文件读写等操作关闭文件注意:可以只打开和关闭文件,不进行任何

2021-09-10 11:48:19 147

原创 20.Python——函数案例

一. 应用:学员管理系统1.1 系统简介需求:进入系统显示系统功能界面,功能如下:1、添加学员2、删除学员3、修改学员信息4、查询学员信息5、显示所有学员信息6、退出系统系统共6个功能,用户根据自己需求选取。1.2 步骤分析显示功能界面用户输入功能序号根据用户输入的功能序号,执行不同的功能(函数)3.1 定义函数3.2 调用函数1.3 需求实现1.3.1 显示功能界面定义函数print_info,负责显示系统功能。def print_info():

2021-09-10 11:46:17 324

原创 19.Python——函数3(递归,lambda表达式,高阶函数)

摘要应用:学员管理系统递归lambda 表达式高阶函数一.今天不想写一二. 递归2.1 递归的应用场景递归是一种编程思想,应用场景:在我们日常开发中,如果要遍历一个文件夹下面所有的文件,通常会使用递归来实现;在后续的算法课程中,很多算法都离不开递归,例如:快速排序。2.1.1 递归的特点函数内部自己调用自己必须有出口2.2 应用:3以内数字累加和代码# 3 + 2 + 1def sum_numbers(num): # 1.如果是1,直接返回1 --

2021-09-10 11:43:01 281

原创 18.Python——函数2(变量作用域,多函数执行流程,返回值,参数,拆包,引用,可变和不可变类型)

摘要变量作用域多函数程序执行流程函数的返回值函数的参数拆包和交换两个变量的值引用可变和不可变类型一. 变量作用域变量作用域指的是变量生效的范围,主要分为两类:局部变量和全局变量。局部变量所谓局部变量是定义在函数体内部的变量,即只在函数体内部生效。def testA(): a = 100 print(a)testA() # 100print(a) # 报错:name 'a' is not defined变量a是定义在testA函数内部的变量,在

2021-09-10 11:30:57 186

原创 17.Python——函数1(函数的使用,参数,返回值,说明文档,嵌套,应用)

摘要函数的作用函数的使用步骤函数的参数作用函数的返回值作用函数的说明文档函数嵌套一. 函数的作用需求:用户到ATM机取钱:输入密码后显示"选择功能"界面查询余额后显示"选择功能"界面取2000钱后显示"选择功能"界面特点:显示“选择功能”界面需要重复输出给用户,怎么实现?函数就是将一段具有独立功能的代码块 整合到一个整体并命名,在需要的位置调用这个名称即可完成对应的需求。函数在开发过程中,可以更高效的实现代码重用。二. 函数的使用步骤2.1 定义函数def

2021-09-10 11:29:40 150

原创 16.Python——推导式

摘要列表推导式字典推导式集合推导式一. 列表推导式作用:用一个表达式创建一个有规律的列表或控制一个有规律列表。列表推导式又叫列表生成式。1.1 快速体验需求:创建一个0-10的列表。while循环实现# 1. 准备一个空列表list1 = []# 2. 书写循环,依次追加数字到空列表list1中i = 0while i < 10: list1.append(i) i += 1print(list1)for循环实现list1 = []

2021-09-10 11:22:07 101

原创 15.Python——公共操作

摘要运算符公共方法容器类型转换一. 运算符运算符描述支持的容器类型+合并字符串、列表、元组*复制字符串、列表、元组in元素是否存在字符串、列表、元组、字典not in元素是否不存在字符串、列表、元组、字典1.1 +# 1. 字符串 str1 = 'aa'str2 = 'bb'str3 = str1 + str2print(str3) # aabb# 2. 列表 list1 = [1, 2]list2 = [10

2021-09-10 11:00:31 112

原创 14.Python——集合

摘要创建集合集合数据的特点集合的常见操作一. 创建集合创建集合使用{}或set(), 但是如果要创建空集合只能使用set(),因为{}用来创建空字典。s1 = {10, 20, 30, 40, 50}print(s1)s2 = {10, 30, 20, 10, 30, 40, 30, 50}print(s2)s3 = set('abcdefg')print(s3)s4 = set()print(type(s4)) # sets5 = {}print(type(

2021-09-10 10:52:25 90

原创 13.Python—字典

摘要字典的应用场景创建字典的语法字典常见操作字典的循环遍历一. 字典的应用场景思考1: 如果有多个数据,例如:‘Tom’, ‘男’, 20,如何快速存储?答:列表list1 = ['Tom', '男', 20]思考2:如何查找到数据’Tom’?答:查找到下标为0的数据即可。list1[0]思考3:如果将来数据顺序发生变化,如下所示,还能用list1[0]访问到数据’Tom’吗?。list1 = ['男', 20, 'Tom']答:不能,数据’Tom’此时下标为2。思考

2021-09-10 10:10:29 116

原创 12.Python——元组

摘要元组的应用场景定义元组元组常见操作一. 元组的应用场景思考:如果想要存储多个数据,但是这些数据是不能修改的数据,怎么做?答:列表?列表可以一次性存储多个数据,但是列表中的数据允许更改。num_list = [10, 20, 30]num_list[0] = 100一个元组可以存储多个数据,元组内的数据是不能修改的。二. 定义元组元组特点:定义元组使用=小括号,且逗号隔开各个数据,数据可以是不同的数据类型。# 多个数据元组t1 = (10, 20, 30)# 单个数据

2021-09-10 10:08:06 170

原创 11.Python——列表

摘要列表的应用场景列表的格式列表的常用操作列表的循环遍历列表的嵌套使用一. 列表的应用场景思考:有一个人的姓名(TOM)怎么书写存储程序?答:变量。思考:如果一个班级100位学生,每个人的姓名都要存储,应该如何书写程序?声明100个变量吗?答:列表即可, 列表一次性可以存储多个数据。二. 列表的格式[数据1, 数据2, 数据3, 数据4......]列表可以一次性存储多个数据,且可以为不同数据类型。三. 列表的常用操作列表的作用是一次性存储多个数据,程序员可以对这些数据进

2021-09-09 17:08:14 200

原创 10.Python——字符串

课程:字符串目标认识字符串下标切片常用操作方法一. 认识字符串字符串是 Python 中最常用的数据类型。我们一般使用引号来创建字符串。创建字符串很简单,只要为变量分配一个值即可。a = 'hello world'b = "abcdefg"print(type(a))print(type(b))注意:控制台显示结果为<class 'str'>, 即数据类型为str(字符串)。1.1 字符串特征一对引号字符串name1 = 'Tom'name2 = "

2021-09-09 16:52:41 412

原创 9.Python——循环结构

目标了解循环while语法【重点】while应用break和continuewhile循环嵌套【重点】while循环嵌套应用【难点】for循环一. 循环简介1.1 循环的作用思考:假如我有个女朋友,有一天我们闹矛盾生气了,女朋友说:道歉,说100遍“媳妇儿,我错了”。这个时候程序员会怎么做?答:100遍print('媳妇儿,我错了')思考:复制粘贴100次吗?答:重复执行100次一样的代码,程序中循环即可循环的作用:让代码更高效的重复执行。1.2 循环的分类在Py

2021-09-09 11:09:26 236

原创 8.Python——条件语句

摘要条件语句作用if语法if…else…多重判断if嵌套一. 了解条件语句假设一个场景:去过网吧吗?去网吧进门想要上网必须做的一件事是做什么?(考虑重点)为什么要把身份证给工作人员?是不是就是为了判断是否成年?是不是如果成年可以上网?如果不成年则不允许上网?其实这里所谓的判断就是条件语句,即条件成立执行某些代码,条件不成立则不执行这些代码。二. if 语法2.1 语法if 条件: 条件成立执行的代码1 条件成立执行的代码2 ......2.

2021-09-09 10:55:32 174

原创 7.Python——运算符

运算符的分类算数运算符赋值运算符复合赋值运算符比较运算符逻辑运算符1. 算数运算符运算符描述实例+加1 + 1 输出结果为 2-减1-1 输出结果为 0*乘2 * 2 输出结果为 4/除10 / 2 输出结果为 5//整除9 // 4 输出结果为2%取余9 % 4 输出结果为 1**指数2 ** 4 输出结果为 16,即 2 * 2 * 2 * 2()小括号小括号用来提高运算优先级,即 (1 +

2021-09-09 10:50:47 92

原创 6.Python——转换数据类型

一. 转换数据类型的作用问:input()接收用户输入的数据都是字符串类型,如果用户输入1,想得到整型该如何操作?答:转换数据类型即可,即将字符串类型转换成整型。二. 转换数据类型的函数函数说明int(x [,base ])将x转换为一个整数float(x )将x转换为一个浮点数complex(real [,imag ])创建一个复数,real为实部,imag为虚部str(x )将对象 x 转换为字符串repr(x )将对象 x 转换为表达式字符

2021-09-09 10:47:34 126

原创 5.Python——输入,输出

输出作用:程序输出内容给用户print('hello Python')age = 18print(age)# 需求:输出“今年我的年龄是18岁”一. 格式化输出所谓的格式化输出即按照一定的格式输出内容。1.1 格式化符号格式符号转换%s字符串%d有符号的十进制整数%f浮点数%c字符%u无符号十进制整数%o八进制整数%x十六进制整数(小写ox)%X十六进制整数(大写OX)%e科学计数法(小写’e’)

2021-09-09 10:38:36 310

原创 4.Python——变量

目标变量的作用定义变量认识数据类型一. 变量的作用举例体验:我们去图书馆读书,怎么样快速找到自己想要的书籍呢?是不是管理员提前将书放到固定位置,并把这个位置进行了编号,我们只需要在图书馆中按照这个编号查找指定的位置就能找到想要的书籍。这个编号其实就是把书籍存放的书架位置起了一个名字,方便后期查找和使用。程序中,数据都是临时存储在内存中,为了更快速的查找或使用这个数据,通常我们把这个数据在内存中存储之后定义一个名称,这个名称就是变量。变量就是一个存储数据的的时候当前数据所在的内存地址

2021-09-09 10:35:53 156

原创 3.Python——注释

目标注释的作用注释的分类及语法注释的特点一. 注释的作用注释的作用不在于表示代码的含义,而在于表示代码的功能。注释是写给人(程序员)看的。电脑不在意你的注释。通过用自己熟悉的语言,在程序中对某些代码进行标注说明,这就是注释的作用,能够大大增强程序的可读性。二. 注释的分类及语法注释分为两类:单行注释 和 多行注释。单行注释只能注释一行内容,语法如下:# 注释内容多行注释可以注释多行内容,一般用在注释一段代码的情况, 语法如下:""" 第一行注释 第

2021-09-09 10:27:05 274

原创 2.PyCharm——下载,安装,使用

2.PyCharm学习目标PyCharm的作用下载安装PyCharmPyCharm的基本使用PyCharm的基本设置一. PyCharm的作用PyCharm是一种Python IDE(集成开发环境),带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,内部集成的功能如下:Project管理智能提示语法高亮代码跳转调试代码解释代码(解释器)框架和库…PythonCharm分为专业版(professional)和社区版(community),本视频以社区

2021-09-09 10:20:02 155

原创 1.Python——解释器

Python解释器一. 解释器的作用Python解释器作用:运行文件Python解释器种类CPython,C语言开发的解释器[官方],应用广泛的解释器。IPython,基于CPython的一种交互式解释器。其他解释器PyPy,基于Python语言开发的解释器。Jython,运行在Java平台的解释器,直接把Python代码编译成Java字节码执行。IronPython,运行在微软.Net平台上的Python解释器,可以直接把Python代码编译成.Net的字节码。二. 下

2021-09-08 09:59:53 89

原创 8.排序——数据结构(严蔚敏C语言版)

8.排序8.1概念1.什么是排序?排序:将一组杂乱无章的数据按一定规律顺次排列起来。即,将无序序列排成一个有序序列(由小到大或由大到小)的运算。如果参加排序的数据结点包含多个数据域,那么排序往往是针对其中某个域而言。8.2插入排序8.2.1直接插入排序1.基本思想:每步将一个待排序的对象,按其关键码大小,插入到前面已经排好序的一组对象的适当位置上,直到对象全部插入为止。即边插入边排序,保证子序列中随时都是排好序的。2.插入方法:在插入a[i]前,数组a的前半段(a[0]----a[i-1

2021-08-18 00:05:40 2118 1

原创 7.查找——数据结构(严蔚敏 C语言版)

7.查找7.1概念7.1.1查找的分类查找表可分为两类:静态查找表:仅作"查询”(检索) 操作的查找表。动态查找表:作"插入"和“删除”操作的查找表。注:有时在查询之后,还需要将"查询”结果为“不在查找表中”的数据元素插入到查找表中;或者,从查找表中删除其"查询”结果为"在查找表中”的数据元素,此类表为动态查找表。7.1.2评价查找算法查找算法的评价指标:关键字的平均比较次数,也称平均查找长度ASL(Average Search Length)(关键字比较次数的期望值)n

2021-08-15 19:37:02 1399

原创 6.图——数据结构(严蔚敏 C语言版)

6.图6.1定义和术语无向图: 每条边都是无方向的有向图: 每条边都是有方向的完全图: 任意两个点都有一条边相连。无向完全图:n个顶点,n(n-1)/2条边有向完全图:n个顶点,n(n-1)条边网: 边/弧带权的图。邻接: 有边/弧相连的两个顶点之间的关系。存在(v, v),则称v,和v互为邻接点;存在<Vi; Vj>,则称vi邻接到vj,vj邻接于vi。顶点的度: 与该顶点相关联的边的数目,记为TD(v);在有向图中,顶点的度等于该顶点的入度与出度之和。顶点v的入

2021-08-06 17:06:33 1647

原创 5.哈夫曼树——数据结构(严蔚敏 C语言版)

5.哈夫曼树5.1概念哈夫曼树: 哈夫曼(Huffman )树又称最优树,是一类带权路径长度最短的树,在实际中有广泛的用途。哈夫曼树的定义,涉及路径、路径长度、权等概念,下面先给出这些概念的定义,然后再介绍哈夫曼树。(1) 路径: 从树中一个结点到另一个结点之间的分支构成这两个结点之间的路径。(2) 路径长度: 路径上的分支数目称作路径长度。(3) 树的路径长度: 从树根到每一结点的路径长度之和。(4) 权: 赋予某个实体的一个量,是对实体的某个或某些属性的数值化描述。在数据结构中,实体有结点(

2021-08-04 18:46:42 3123

原创 4.树和森林——数据结构(严蔚敏 C语言版)

2.10树和森林2.10.1树的存储1.双亲表示法节点形式:数据域:存放结点本身信息。双亲域:指示本结点的双亲结点在数组中的位置。2.孩子表示法,双亲孩子表示法3.孩子兄弟表示法节点形式:具体形式:2.11树,森林,二叉树的转换2.11.1树转二叉树步骤:所有的相邻兄弟结点间加一条连线;保留每个节点与第一个孩子间的连线,删去其他线;将所生成的二叉树顺时针旋转45°;转换后的根节点的右孩子必为空。2.11.2森林转二叉树步骤:把森林中的树全部转换

2021-07-29 19:11:08 321

原创 4.树和二叉树——数据结构 (严蔚敏C语言版)

1.树1.1树的定义树(Tree)是n(n≥0)个结点的有限集,它或为空树(n=0);或为非空树,对于非空树T:(1)有且仅有一个称之为根的结点;(2)除根结点以外的其余结点可分为m (m>0)个互不相交的有限集T1, T2,…,Tm,其中每一个集合本身又是一棵树,并且称为根的子树( SubTree )。1.2树的基本术语1.结点: 树中的一个独立单元。包含一个数据元素及若干指向其子树的分支,如中的A、B、C、D等。2. 结点的度: 结点拥有的子树数称为结点的度。例如,A的度为3,

2021-07-29 00:57:57 965

原创 3.串,数组,广义表——数据结构 (严蔚敏C语言版)

串,数组,广义表串的定义串(String): 零个或多个任意字符组成的有限序列。子串: 一个串中任意个连续字符组成的子序列(含空串)称为该串的子串。主串: 包含子串的串相应地称为主串。字符位置: 字符在序列中的序号为该字符在串中的位置。子串位置: 子串第一个字符在主串中的位置。空格串: 由一个或多个空格组成的串,与空串不同。例:字符串a、b、c、da= D,b= ‘JING'C=‘BEIJING'd=‘BEI JING'------------它们的长度是:3 4 7 8c的

2021-07-23 17:19:29 515

原创 2.栈和队列——数据结构 (严蔚敏C语言版)

【思考】假设有3个元素a, b,c,入栈顺序是a,b,c,则它们的出栈顺序有几种可能?

2021-07-19 17:36:37 851 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除