![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
人工智能
Python私教
收徒弟,接私活,有直播课和私教课,可以做家教和川渝线下教学,包教会 18010070052。
展开
-
Python中的递归函数常用示例
【代码】Python中的递归函数常用示例。原创 2024-05-17 14:50:59 · 128 阅读 · 0 评论 -
机器学习算法之随机森林
实现方式是调节随机森林的 n_jobs 参数,记得把 n_jobs 参数数值设为和 CPU 内核数一致,比如你的 CPU 内核数是 2,那么 njobs 参数设为3或者更大是没有意义的。如果是用来进行回归分析的话,随机森林会把所有决策树预测的值取平均数:如果是用来进行分类的话,在森林内部会进行“投票”,每棵树预测出数据类别的概率,比如其中一棵树说,“这瓶酒 80% 属于 class 1”,另外一棵树说,“这瓶酒 60%属于 class 2”,随机森林会把这些概率取平均值,然后把样本放入概率最高的分类当中。原创 2024-05-17 10:52:16 · 317 阅读 · 0 评论 -
机器学习之决策树算法
另外,从图像来看,不同的点大致都能落入到自己的区域中,相比深度为1的时候更加的准确一点。从结果来看,分数变成了0.84,已经是一个比较能够接受的分数了。从结果来看,分类器的表现并不是特别好,我们可以加大深度试试。从结果来看,分数从0.84变成了0.93,明显更加的准确了。原创 2024-05-16 16:41:42 · 243 阅读 · 0 评论 -
机器学习高斯贝叶斯算法实战:判断肿瘤是良性还是恶性
我们使用威斯康星乳腺肿瘤数据集,来构建一个机器学习模型,用来判断患者的肿瘤是良性还是恶性。原创 2024-05-16 15:54:59 · 734 阅读 · 0 评论 -
多项式贝叶斯算法
二项式分布可以用抛硬币的案例来理解,多项式分布可以用投骰子来理解。骰子有六个面,所以每次投骰子,都是六种可能中的一种。那么我们投骰子n次,每个面朝上的次数分布情况,就是一个多项式分布。原创 2024-05-16 14:53:36 · 163 阅读 · 0 评论 -
高斯贝叶斯算法
高斯贝叶斯算法,是假设样本的特征符合高斯分布,或者说符合正态分布时所使用的算法。原创 2024-05-16 14:21:32 · 293 阅读 · 0 评论 -
贝努利贝叶斯算法
【代码】贝努利贝叶斯算法。原创 2024-05-16 14:06:54 · 95 阅读 · 0 评论 -
线性回归模型之套索回归
本案例是基于之前的岭回归的案例的。# 将数据拆分20次用来对模型进行评分est,X,y,# 获取模型名称# 绘制模型评分# 加载数据# 绘制图形plt.show()原创 2024-05-16 13:42:01 · 243 阅读 · 0 评论 -
线性模型之岭回归的用法
【代码】线性模型之岭回归的用法。原创 2024-05-15 17:42:55 · 370 阅读 · 0 评论 -
线性模型快速入门
【代码】线性模型快速入门。原创 2024-05-15 17:18:58 · 350 阅读 · 0 评论 -
KNN算法项目实战之酒的分类
features_names:特征变量名称。target_names:目标分类名称。分数只有0.75,比较低。target:目标分类。DESCR:数据描述。原创 2024-05-15 16:48:34 · 632 阅读 · 0 评论 -
KNN算法用于回归分析
KNN近邻数量默认是5,我们调低为2试试。分数从0.77提升到了0.86。原创 2024-05-15 15:58:50 · 183 阅读 · 0 评论 -
KNN算法处理多元分类任务
这个案例还是基于之前的案例进行改造。# KNN 分类器# 画图工具# 数据集拆分工具# 数据分析# 生成样本数为200,分类为2的数据集# 创建knn分类器# 画图# 绘制数据集# 把新的数据点用五角星表示出来plt.show()# 预测。原创 2024-05-15 15:48:29 · 275 阅读 · 0 评论 -
使用KNN预测一个新的点,以及将这个点用五角星进行matplotlib可视化展示
基于之前的KNN案例继续做一些操作。# KNN 分类器# 画图工具# 数据集拆分工具# 数据分析# 生成样本数为200,分类为2的数据集# 创建knn分类器# 画图# 绘制数据集plt.show()原创 2024-05-15 14:55:30 · 334 阅读 · 0 评论 -
使用make_blobs生成数据并使用KNN机器学习算法进行分类和预测以及可视化
使用make_blobs生成数据并使用matplotlib进行可视化。原创 2024-05-15 14:47:03 · 238 阅读 · 0 评论 -
理想国pandas练习题5
需求现在我们有一组关于全球星巴克店铺的统计数据,如果我想知道美国的星巴克数量和中国的哪个多,或者我想知道中国每个省份星巴克的数量的情况,那么应该怎么办?数据来源:https://www.kaggle.com/starbucks/store-locations/data数据获取从文件中读取星巴克店铺数据# 导入星巴克店的数据starbucks = pd.read_csv("./data/starbucks.csv")进行分组聚合# 按照国家分组,求出每个国家的星巴克零售店数量count原创 2021-02-13 19:14:03 · 591 阅读 · 1 评论 -
理想国pandas练习题4
需求存在test.json文件(文末),请完成以下需求题1:读取json文件,并存储为csv文件题1# 题1:读取json文件,并存储为csv文件import pandas as pddf = pd.read_json('data/test.json', lines=True)print(df.head())print('-----------------')df.to_csv('data/test.csv', index=False)df1 = pd.read_csv('data原创 2021-02-13 19:12:10 · 1492 阅读 · 0 评论 -
理想国pandas练习题3
需求存在test.json文件(文末),请完成以下需求题1:读取json文件,并存储为csv文件题1# 题1:读取json文件,并存储为csv文件import pandas as pddf = pd.read_json('data/test.json', lines=True)print(df.head())print('-----------------')df.to_csv('data/test.csv', index=False)df1 = pd.read_csv('data原创 2021-02-13 19:10:46 · 2114 阅读 · 0 评论 -
理想国pandas教程(版本01)
Pandas介绍简介2008年WesMcKinney开发出的库专门用于数据挖掘的开源python库以Numpy为基础,借力Numpy模块在计算方面性能高的优势基于matplotlib,能够简便的画图独特的数据结构为什么使用Pandas增强图表可读性便捷的数据处理能力读取文件方便封装了Matplotlib、Numpy的画图和计算pandas的优势【了解】增强图表可读性便捷的数据处理能力读取文件方便封装了Matplotlib、Numpy的画图和计算Pandas数据结原创 2021-02-13 18:50:18 · 451 阅读 · 0 评论 -
理想国pandas练习题2
需求存在stock.csv文件(文末),请完成以下需求题1:读取p_change列并计算前n天的累计和,然后绘制折线图题2:实现股票涨跌幅数据的离散化,并进行one-hot编码题3:使用交叉表计算星期与股票涨跌幅的关系题4:使用透视计算星期与股票涨跌幅的关系题1# 题1:读取`p_change`列并计算前n天的累计和,然后绘制折线图import pandas as pdimport matplotlib.pyplot as pltdf = pd.read_csv('data/sto原创 2021-02-13 18:06:07 · 576 阅读 · 1 评论 -
理想国pandas练习题01
需求创建一个100行6列的DataFrame行索引是“学生1-学生100”列索引是“语文,数学,英语,政治,历史,地理”值是:0-100之间的随机整数需求分析如何创建列索引columns = ['语文', '数学', '英语', '政治', '历史', '地理']如何创建行索引index = ['学生{}'.format(i) for i in range(1, 101)]如何创建成绩import numpy as npvalues = np.random.randint(0原创 2021-02-12 22:31:17 · 161 阅读 · 0 评论 -
knn算法预测癌症肿瘤
项目地址https://gitee.com/lxgzhw/sklearn_study源码import matplotlib.pyplot as pltfrom sklearn.datasets import load_breast_cancerfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassifier# 导入数据cancer = load_bre原创 2021-02-07 21:24:58 · 783 阅读 · 0 评论 -
knn算法预测鸢尾花分类
项目源码git地址https://gitee.com/lxgzhw/sklearn_study实现代码import numpy as npfrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassifier# 获取鸢尾花数据集iris_datasets = load_iris()原创 2021-02-06 16:36:32 · 316 阅读 · 0 评论 -
理想国pytorch入门教程
01.简介pytorch是一个能在CPU和GPU上运行并解决各类深度学习问题的深度学习框架可以将其看作是支持GPU计算和自动微分计算的Numpy库pytorch是一个灵活,容易学习的python库,在学术和研究领域pytorch是最受欢迎的深度学习库pytorch是tensorflow最强有力的竞争对手pytorch框架的产生受到torch和chainer这两个框架的启发与torch使用lua语言相比,pytorch是一个python优先的框架,我们可以继承pytorch类然后自定义与cha原创 2021-01-17 20:53:10 · 265 阅读 · 0 评论 -
理想国线性回归算法入门教程
01.简介概念线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。特点:只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归使用场景房价预测销售额度预测贷款额度预测02.入门案例基本步骤导入依赖准备数据数据基本处理特征工程机器学习模型评估示例:假设知道一组学生的平时成绩和期末考试成绩及最终成绩,现在有一个新的同学,知道他的平时成绩和期末考试成绩,那么他的期原创 2020-12-18 22:19:46 · 184 阅读 · 1 评论 -
理想国matplotlib入门教程
简介个人简介姓名:张大鹏性别:男生日:1993年8月29日爱好:学习座右铭:不积跬步无以至千里,不积小流无以成江海。优点:自律,稳重,热爱学习缺点:胖胖的课程简介教大家怎么简单的使用python做数据分析并可视化matplotlib简介python数据分析必学的基础库能够轻松的绘制折线图,柱状图,散点图,饼图等常见可视化图表使用简单,numpy,pandas,matplotlib是python数据分析中最常见的工具组合一般用于将python数据进行可视化安装:pip原创 2020-12-17 20:08:16 · 641 阅读 · 2 评论 -
理想国pandas入门教程
01.简介以Numpy为基础,借力Numpy模块在计算方面性能高基于matplotlib,能够简便的画图独特的数据结构02.优势增强图表的可读性便捷的处理数据的能力读取文件方便封装了matplotlib,numpy的画图和计算03.Series结构概念一维的数组数据结构能够保存任意类型的数据语法pd.Series(data=None, index=None, dtype=None)用于创建Series结构参数data:传入的数据,可以是ndarray,li原创 2020-12-14 20:51:54 · 531 阅读 · 2 评论 -
理想国Numpy入门教程
01.简介Numpy(Numerical Python)是一个开源的Python科学计算库,用于快速处理任意维度数组Numpy支持常见的数组和矩阵操作,对于同样的数值计算任务,使用Numpy比直接使用Python要简洁得多Numpy使用ndarray对象处理多维数组,该对象是一个快速而灵活的大数据容器02.ndarray介绍Numpy提供了一个N维数组类型ndarray它描述了相同类型的items的集合举例:将下面的表格转换为二维数组# coding:utf-8# 作者:理想国真原创 2020-12-13 19:23:27 · 667 阅读 · 0 评论