Python数据分析
文章平均质量分 80
亿是守候 & 亿是承诺
,
展开
-
统计学习/机器学习常用小知识
文章目录统计学习的特点统计学习的方法机器学习的步骤统计学习的目的统计学习的应用领域机器学习的主要任务分类与回归的区别1. 输出不同1.1分类问题是输出**物体的所属类别**,而回归问题输出的是**物体的值**。1.2分类问题输出的值是离散的,回归问题输出的值是连续的1.3 分类问题输出是定性的,回归问题输出是定量的2.目的不同3.本质不同4.结果不同3.场景不同3.1分类问题3.2回归应用统计学习的特点关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科统计学习的方法机器学习原创 2022-03-21 15:12:37 · 1592 阅读 · 0 评论 -
机器学习实战--决策树算法
决策树决策树(decision tree)是一种基本的分类与回归方法。从判断模块引出的左右箭头称为分支,它可以达到另外一个判断模块或者终止模块。分类决策树模型是一种描述对实例进行分类的树形结构。决策树由节点(node)和有向边(directed edge)组成。节点有内部节点(internal node)和叶节点(leaf node)。内部节点表示一个特征或者属性,叶节点表示一个类。1. 决策树流程:收集数据:可以使用任何方法收集到的数据。准备数据:收集完数据之后,我们要对数据进行整理,将这些数原创 2022-02-26 22:19:14 · 281 阅读 · 0 评论 -
机器学习实战-- K-近邻算法
K-近邻算法K近邻算法(KNN)是1967年提出的一种基本的分类与回归的方法。工作原理是:存在一个样本数据集合,也称作为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新的数据每个特征与样本集中的数据对应特征进行比较,然后算法提取样本最相似数据的分类标签。一般来说,我们只选择样本数据集中前K个最相似的数据,这就是K-近邻算法的K的出处,通常K是不大于20的整数。最后,选择K个最相似数据中出现次数最多的分类,作为新数据的分类。1.分类一原创 2022-02-24 16:30:15 · 290 阅读 · 0 评论 -
Python游戏开发--外星人入侵(源代码)
文章目录1.效果展示2. 《外星人入侵》源代码2.1 image2.2 alien_invasion.py2.3 alien.py2.4 bullet.py2.5 button.py2.6 game_stats.py2.7 scoreboarf.py2.8 settings.py2.9 ship.py最近学习的python第一个项目实战,《外星人入侵》,成功实现所有功能,给大家提供源代码环境安装:python 3.7+ pygame安装 pygamepip install -- user pygam原创 2022-01-13 21:41:39 · 7460 阅读 · 14 评论 -
python机器学习--sklearn数据集使用
文章目录1.sklearn介绍2.基本概括2.1 估计器2.2 转化器3.sklearn中iris莺尾花数据集使用1.sklearn介绍Scikit-learn(以前称为scikits.learn,也称为sklearn)是针对Python 编程语言的免费软件机器学习库 。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值和DBSCAN,并且旨在与Python数值科学库NumPy和SciPy联合使用。sklearn是一个Python第三方提供的非常强力的机器学习库,它包含了从数据预原创 2022-01-04 22:10:42 · 1542 阅读 · 0 评论 -
Python-学生信息管理系统.exe(代码)
学生信息管理系统的页面展示在前面已经介绍过了:Python-学生信息管理系统.exe下面是这个.exe文件完整代码,可以直接运行的代码代码如下所示import os #获取文件信息filename='stduent.txt'def main(): # 定义主函数 while True: #默认执行 menm() #调用定义的menm函数,打印主菜单功能 choice=int(input('请选择:')) #输入选择的功能 if ch原创 2022-01-04 21:49:44 · 279 阅读 · 0 评论 -
python基础教程--代码集合(下)
文章目录38.字典dict38.1 创建字典38.2 字典获取元素38.3 key字典38.4key-value-items键值对38.5字典的遍历38.6 哈希函数haxi39.可变序列与不可变序列39.1可变序列:列表,字典39.2不可变序列,字符串,元组40.元组tuple40.1创建元组40.2 元组的不可变性40.3元组遍历41.集合set41.1 创建集合set41.2 集合的相关操作41.3集合:交集、并集、差集、堆成差集41.4 集合生成式42 字符串42.1 字符串的驻流机制42.2 字符原创 2022-01-04 21:37:49 · 770 阅读 · 0 评论 -
python基础教程--代码集合(上)
python基础教程代码总结原创 2022-01-04 14:58:28 · 958 阅读 · 0 评论 -
pytorch环境安装(配置:CUDA11.1+CUDNN11.1+torch.9.0+cu111+torchvision0.10.0+cu111+torchaudio==0.9.0)
文章目录1.下载CUDA2 .下载CUDNN3.CUDA安装4.安装CUDNN5.下载pytorch6.安装pytorch在安装之前先要知道自己的显卡支持什么CDUA版本右键点击进入NVIDIA控制面板选择帮助——系统信息——组件这里可以看出我的笔记本支持的CUDA版本为11.5或者在命令行搜索cmd,打开命令提示符输入NVIDIA-smi就可以看到版本信息1.下载CUDA我这里安装的CUDA11.1版本进入CUDA官网下载CUDA11.1:CUDA Toolkit 11.1 Up原创 2021-12-28 15:01:10 · 7734 阅读 · 1 评论 -
Python-学生信息管理系统.exe
文章目录0.将python文件转成exe 文件1.录入学生信息2.查找学生信息3.删除学生信息4.修改学生信息5.排序6.统计学生总人数7.实现所有学生信息0.退出不需要安装python也能运行学生信息管理系统功能功能菜单0.将python文件转成exe 文件将python程序打包成exe,电脑没安装Python也可以实现将Python文件转成exe文件首先安装第三方模块pip install PyInstaller安装成功之后,就可以进行将文档转成exe了方式:pyinstaller原创 2021-12-26 21:16:42 · 2792 阅读 · 1 评论 -
决策树算法绘图——graphviz安装
Graphviz自带决策树绘图工具,可以通过安装库实现绘图,不需要手动绘图。下图为graphviz库的决策树绘制的图形1.下载graphviz进入官网:graphviz官网文件,下载之后,选择合适的版本下载即可,我选择的是graphviz–2.49.2版本安装按照默认选项即可安装完成2.配置环境安装之后,需要手动配置环境,找到安装好的graphviz2.49.2文件夹复制Bin下面文件夹的路径在window系统中配置环境变量找到我的电脑,点击属性,找到高级系统设置在高级–环境变量点原创 2021-11-10 22:00:36 · 3633 阅读 · 1 评论 -
Tableau---数据可视化软件
文章目录1. Tableau简介1.1 Tableau Public 和Tableau Desktop的区别:1.2 下载和安装2. 数据准备2.1 导入tableau数据表3. 绘制世界地图3.1 地图背景设置4.合并仪表盘今天主要教大家如何绘制世界地图和组合图,Tableau是一个很好的工具,先给大家展示一下效果,可以根据自己的需要绘制不同的图形1. Tableau简介Tableau 是一款企业级的大数据可视化工具。Tableau 可以让你轻松创建图形,表格和地图。 它不仅提供了PC桌面版原创 2021-10-14 15:40:53 · 5154 阅读 · 0 评论 -
深度学习---卷积神经网络(CNN)
文章目录1. 什么是深度学习?2. 深度学习框架2.1 卷积神经网络(CNN)2.1.1 引子 :边界检测2.1.2 CNN的基本概念2.1.3 CNN的结构组成2.1.4 卷积神经网络 VS. 传统神经网络1. 什么是深度学习?深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标–人工智能(AI, Artificial Intelligence)。深度学习是学习样本数据的内在规律和表示层次,原创 2021-10-12 11:46:19 · 6464 阅读 · 0 评论 -
Python实战---王者荣耀皮肤爬虫
文章目录方法1方法2作为王者荣耀的老玩家,今天教大家如何用python爬虫获取王者荣耀皮肤本文将介绍两种王者荣耀皮肤的爬取方法,一种比较简单的,一种复杂的方法供大家学习。首先先进去王者荣耀官方网站:王者荣耀进入开发者工具找到英雄皮肤所在位置,图中herolist.json就是我们需要找的英雄列表,包括英雄编号、英雄名称、影响类型、皮肤等信息,复制url:http://pvp.qq.com/web201605/js/herolist.json路径方法1见注释# 导入所需要的模块import原创 2021-10-11 13:49:19 · 6661 阅读 · 12 评论 -
Python机器学习---Pyecharts制作可视化大屏
文章目录Pyecharts可视化Map世界地图柱状图、饼图Pyecharts组合图表ECharts是由百度开源的基于JS的商业级数据图表库,有很多现成的图表类型和实例,而Pyecharts则是为了方便我们使用Python实现ECharts的绘图。使用Pyecharts制作可视化大屏,可以分为两步:1、使用分别Pyecharts分别制作各类图形;2、使用Pyecharts中的组合图表功能,将所有图片拼接在一张html文件中进行展示。小五认为影响大屏美观最重要的两个因素就是:配色和布局!在本文中,会特意原创 2021-10-01 15:49:33 · 7836 阅读 · 4 评论 -
Python机器学习---2.聚类分析代码部分
1. 手写⼀个简单的Kmeans算法导入所需要的包# 导入一些包import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.datasets import make_blobs模拟数据# 模拟出一些数据集出来#r = np.random.randint(1,100)r = 4#print(r)k原创 2021-09-26 22:06:11 · 1540 阅读 · 0 评论 -
Python机器学习---2.聚类算法理论部分
文章目录1.聚类分析1.1 无监督学习与聚类算法1.1.1.旨在理解数据自然结构的聚类1.1.2 用于数据处理的聚类1.2 核心概念1.2.1 聚类分析1.2.2 簇1.3 基于原型的聚类技术: K-Means1.3.1 基于原型的簇1.3.2. K-Means基本定义1.3.3 算法执行细节距离衡量方法文本距离1.3.4 误差平方和SSE (Sum of the Squared Error, SSE)1.3.5 聚类目标函数和质心计算方法1.聚类分析1.1 无监督学习与聚类算法决策树、线性和逻辑回归原创 2021-09-26 19:58:43 · 947 阅读 · 0 评论 -
Python机器学习---何为机器学习?
文章目录1. 从人工智能到机器学习2. 数据科学3.算法大类4. 学习计划4.1 推荐课本1. 从人工智能到机器学习简单来说,机器学习是门研究让计算机学习,让计算机程序能够进化的学科。2. 数据科学虽然机器学习的研究来源于人工智能领域,但是机器学习的方法却应用于数据科学领域,因此我们将机器学习看作是一种数学建模更合适。机器学习的本质就是借助数学模型理解数据。当我们给模型装上可以适应观测数据的可调参数时,“学习” 就开始了:此时的程序被认为具有从数据中“学习” 的能力。 一旦模型可以拟合旧的观测原创 2021-09-24 15:00:56 · 402 阅读 · 0 评论 -
Python机器学习---KNN模型评价、追求
文章目录1. KNN模型评价1.1 计算效率低,耗费计算资源较大1.2 抗噪性较弱,对噪声数据(异常值)较为敏感1.3 模型不稳定,可重复性较弱1.4要进行归化处理:2.模型的追求2.1 模型效果2.2 运算速度2.3 可解释性2.4 服务于业务1. KNN模型评价到这里,能够对KNN进行的全部优化就已经完成了。KNN代表若"投票类"的算法,一直广泛受到业界的欢迎。不过KNN也有自己的缺点,那就是它的计算非常缓慢,因为KNN必须对每一个测试点来计算到每一 个训练数据 点的距离,并且这些距离点涉及到所有的原创 2021-09-24 14:46:33 · 1187 阅读 · 0 评论 -
Python机器学习--KNN归一化、距离的惩罚
1. 归一化1.1 距离类模型归一化的需求什么是归一化呢?我们把X放到数据框中来看一一眼, 你是否观察到,每个特征的均值差异很大?有的特征数值很大。有的特征数值很小,这种现象在机器学习中被称为"星纲不统一"。 NN是距离类模型,欧氏距离的计算公式中存在若特征上的平方和:试想看看,如果某个特征x的取值非常大,其他特征的取值和它比起来都不算什么,那距离的大小很大程度上都会由这个巨大特征x来决定,其他的特征之间的距离可能就无法对d(A,B) 的大小产生什么影响了,这种现象会让KNN这样的距离类模型的效果大原创 2021-09-23 22:41:25 · 824 阅读 · 0 评论 -
Python机器学习-- KNN学习曲线、K值、交叉验证
文章目录1.breast_cancer 数据集准确度计算2.学习曲线2.1 选择最优K值2.2 不同K取值对模型的影响2.3 神器之一:学习曲线2.3.1 选取最优的K值2.4交叉验证2.4.1 泛化能力2.5 神器之二:K折交叉验证2.6 绘制带交叉验证的学习曲线2.7 是否需要验证集?2.8 交叉验证的方法2.9 避免折数设置太大!1.breast_cancer 数据集准确度计算# breast_cancer 数据集from sklearn.neighbors import KNeighbors原创 2021-09-23 21:36:24 · 4948 阅读 · 0 评论