python
文章平均质量分 77
python基础知识
小玩偶啊
。。。。。
展开
-
预测facebook签到位置
1 项⽬描述本次⽐赛的⽬的是预测⼀个⼈将要签到的地⽅。 为了本次⽐赛,Facebook创建了⼀个虚拟世界,其中包括10公⾥*10 公⾥共100平⽅公⾥的约10万个地⽅。 对于给定的坐标集,您的任务将根据⽤户的位置,准确性和时间戳等预测⽤户下 ⼀次的签到位置。 数据被制作成类似于来⾃移动设备的位置数据。 请注意:您只能使⽤提供的数据进⾏预测。2 数据集介绍⽂件说明 train.csv, test.csv row id:签⼊事件的id x y:坐标 accuracy: 准确度,定位精度原创 2022-03-14 00:46:04 · 2222 阅读 · 0 评论 -
鸢尾花种类预测—流程实现
1. 再识K-近邻算法APIsklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm=‘auto’)n_neighbors:int,可选(默认= 5),k_neighbors查询默认使⽤的邻居数algorithm:{‘auto’,‘ball_tree’,‘kd_tree’,‘brute’}快速k近邻搜索算法,默认参数为auto,可以理解为算法⾃⼰决定合适的搜索算法。除此之外,⽤户也可 以⾃⼰指定搜索算法ball_tree、原创 2022-03-13 16:57:47 · 1128 阅读 · 0 评论 -
特征工程---特征预处理
1. 什么是特征预处理1.1 特征预处理定义通过⼀些转换函数将特征数据转换成更加适合算法模型的特征数据过程为什么我们要进⾏归⼀化/标准化?特征的单位或者⼤⼩相差较⼤,或者某特征的⽅差相⽐其他的特征要⼤出⼏个数量级,容易影响(⽀配)⽬标 结果,使得⼀些算法⽆法学习到其它的特征1.2 包含内容(数值型数据的⽆量纲化)归⼀化标准化1.3 特征预处理APIsklearn.preprocessing2 归⼀化2.1 定义通过对原始数据进⾏变换把数据映射到(默认为[0,1])之间2.原创 2022-03-13 16:28:58 · 1058 阅读 · 0 评论 -
鸢尾花种类预测
本实验介绍了使⽤Python进⾏机器学习的⼀些基本概念。 在本案例中,将使⽤K-Nearest Neighbor(KNN)算法对鸢 尾花的种类进⾏分类,并测量花的特征。1. 数据集介绍Iris数据集是常⽤的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是⼀类多重变量分析的数据 集。关于数据集的具体介绍:2 scikit-learn中数据集介绍2.1 scikit-learn数据集API介绍sklearn.datasets加载获取流⾏数据集datasets.原创 2022-03-13 15:09:08 · 918 阅读 · 0 评论 -
北京租房数据分析
1. 数据基本处理import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom pylab import mpl # 设置显示中文字体 mpl.rcParams["font.sans-serif"] = ["SimHei"]file_data=pd.read_csv("./data/链家北京租房数据.csv")file_data.head(10)1.1原创 2022-02-13 19:58:43 · 1435 阅读 · 3 评论 -
NBA球员分析
文章目录1. 获取数据2. 数据分析2.1 数据相关性2.2 基本数据排名分析2.3 Seaborn常用的三个数据可视化方法2.3.1 单变量2.3.2 双变量2.3.3 多变量2.3.4 衍生变量的一些可视化实践-以年龄为例3. 球队数据分析3.1 球队薪资排行3.2 按照分球队 分年龄段,上榜球员数相同,则按照效率值降序排列3.3 按照球队综合实力排名3.4 利用箱线图和小提琴图进行数据分析1. 获取数据data=pd.read_csv("./data/nba_2017_nba_playe原创 2022-02-13 18:41:58 · 1126 阅读 · 1 评论 -
机器学习基础
文章目录1. 机器学习概述1.1 人工智能概述1.1.1 机器学习与人工智能、深度学习1.1.2 机器学习、深度学习能做些什么1.2 什么是机器学习1.2.1 数据集构成1.3 机器学习算法分类1.4 机器学习开发流程1.5 学习框架和资料介绍1.5.1 机器学习库与框架2. 特征工程2.1 数据集2.1.1 可用数据集2.1.2 sklearn数据集2.1.3 数据集的划分定位:课程以算法、案例为驱动的学习,伴随浅显易懂的数学知识作为人工智能领域(数据挖掘/机器学习方向)的提升课程,掌握更深更有效原创 2022-01-13 11:08:53 · 1121 阅读 · 1 评论 -
matplotlib的基本使用
1. matplotlib的好处matplotlib是专门用于开发2D图表(也包括3D)以渐近、交互的方式实现数据可视化2. 为什么要学习matplotlib?可以将数据进行可视化、更直观的展示是数据更加客观、更加具有说服力3. 基本操作3.1 绘制一个折线图创建画布绘制图像图像显示import matplotlib.pyplot as plt#创建画布plt.figure()#绘制图像plt.plot([1,2,3,4,5,6,7],[10,15,20,12,24原创 2021-07-03 18:35:19 · 177 阅读 · 1 评论 -
numpy的基本使用
1. Numpy介绍Numpy(Numerical Python)是一个开源的Python科学计算库,用于快速处理任意维度的数组。Numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用Numpy比直接使用Python要简洁的多。Numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器。2 ndarray介绍NumPy提供了一个N维数组类型ndarray,它描述了相同类型的“items”的集合3 ndarray与Python原生list运算效率对比ndar原创 2021-07-04 12:28:02 · 790 阅读 · 3 评论 -
Pandas的基本使用
1. Pandas的基础1.1 Pandas的介绍专门用于数据挖掘的开源python库以Numpy为基础,借力Numpy模块在计算方面性能高的优势基于matplotlib,能够简便的画图独特的数据结构1.2 为什么使用Pandas增强图表可读性便捷的数据处理能力读取文件方便封装了Matplotlib、Numpy的画图和计算2. Pandas数据结构Pandas中一共有三种数据结构,分别为:Series、DataFrame和MultiIndex(老版本中叫Panel )。 其中原创 2021-07-05 23:19:28 · 566 阅读 · 9 评论 -
机器学习--笔记
文章目录1. 基本概念1.1人工智能发展的三要素1.人工智能的主要分支1.2 机器学习概述1.3 机器学习算法分类1.4 机器学习的基本流程:1.5 模型评估拟合:1. 基本概念1.1人工智能发展的三要素数据算法计算力机器学习是人工智能的一个实现途径深度学习是机器学习的一个方法发展而来图灵测试达特茅斯会议1.人工智能的主要分支计算机视觉(CV)计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。物体检测和人脸识别原创 2021-07-02 19:56:52 · 150 阅读 · 2 评论 -
Python基础
1. 基础语法1.1 基本语法输出函数print('he\aaa\aaa')# 这是一个打印语句,请你看见了不要慌张print('abc') # 这是一个单行注释c = f'hello {a} {b}'print(f'a = {a}')# 占位符print('欢迎 %s 光临!'%name)# 格式化字符串print(f'欢迎 {name} 光临!')Python中使用变量,不需要声明,直接为变量赋值即可不能使用没有进行过赋值的变量在Python中注意遵循两原创 2021-06-19 17:52:47 · 63 阅读 · 0 评论