![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 78
寒塘独恪
这个作者很懒,什么都没留下…
展开
-
飞机大战-Python
用两个模块完成主模块:plane_main.pyimport pygamefrom plane_sprites import *class PlaneGame: """飞机大战主游戏""" def __init__(self): print("游戏初始化") # 创建游戏窗口 self.screen = pygame.display.set_mode(SCREEN_RECT.size) # 创建游戏时钟 .原创 2022-03-03 16:51:01 · 295 阅读 · 0 评论 -
爬取华北理工教务处成绩——巧妙利用selenium和request.session组合
1原创 2021-08-04 15:33:32 · 759 阅读 · 2 评论 -
Anaconda安装谷歌浏览器驱动chromedriver(Windows系统)
使用selenium工具包时,需要安装浏览器驱动。步骤1、安装selenium包,打开cmd输入pip install selenium2、下载浏览器驱动,你用什么样的浏览器就下载什么样的驱动,这里以谷歌浏览器为例。下载地址下载之前需要查看你谷歌浏览器的版本查看方式:打开帮助,点击关于Google Chrome下载相应的版本即可。点击进去,下载chromdriver_win32即可。有时候可能没有相对应的版本,也可以下载之前的版本。3、将下载的zip解压缩,得到.exe文件,原创 2021-08-02 10:25:41 · 2469 阅读 · 0 评论 -
机器学习基础|线性回归中正规方程和梯度下降的比较
线性回归在进行优化的过程中,有正规方程和梯度下降两种方法,这两种方法都可以对权重进行更新,但同时也都有各自的优缺点。sklearn库中有两种算法的封装,API分别为:sklearn.linear_model.LinearRegression:正规方程(最小二乘法)sklearn.linear_model.SGDClassifier:梯度下降以波士顿房价预测为例进行两种算法的比较。实例1、导入库import pandas as pdimport numpy as npfrom sklear原创 2021-07-21 10:16:03 · 723 阅读 · 1 评论 -
机器学习基础|随机森林原理及实战
随机森林,顾名思义,是利用随机的方式建立成的一个森林,该森林由很多决策树组成,并且决策树之间没有任何关联。是一种集成学习方法,应用广泛,效果极佳。文章目录随机森林随机森林的定义随机森林的建立过程随机森林的优缺点随机森林实战Sklearn随机森林API实战随机森林随机森林的定义定义:在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。举个例子,比如现在训练了10棵决策树,其中8棵树的结果是True,2棵树是False,那么最终结果会是True,因为在1原创 2021-07-11 09:45:30 · 810 阅读 · 0 评论 -
机器学习基础|Sklearn实现决策树
Sklearn决策树APIsklearn.tree.DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=None, min_samples_split=2,min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=None, min_impurity_decrease=0.0,原创 2021-07-09 16:29:55 · 1000 阅读 · 0 评论 -
Anaconda安装Graphviz(决策树可视化工具)
anaconda安装Graphviz最简单的方法:打开cmd输入conda install python-graphviz等待安装结束即可。安装结束之后,打开cmd进入到tree.dot的位置。例如我把这个文件放在了桌面,所以我需要在cmd中打开桌面。输入dot -Tpng tree.dot -o tree.png即可将dot转化为png。图片如下也可转为pdf文件dot -Tpdf tree.dot -o tree.pdf...原创 2021-07-09 15:35:29 · 1991 阅读 · 2 评论 -
机器学习基础|被吹了半天的决策树原理,就这么简单?
说起决策树,不禁想到了第一次用决策树解决问题时的场景。当时是解决机械领域一个轴承故障分类问题,效果很好,也是从那开始开始决策树走进了我的心里。当时对原理理解的不清楚,但后来学了原理之后才发现我还可以把模型改进的更好。众所周知,决策树是一种简单高效并且具有强解释性的模型,被广泛应用于数据分析领域。在建树之前我们需要考虑一些问题,比如这棵树是怎么生成的?数中节点的位置怎么确定?根据什么进行分类等等。要弄懂决策树最关键的要弄懂信息增益决策树什么是决策树顾名思义,决策树就是一棵树。一颗决策树包含一个根节点、原创 2021-07-08 17:31:48 · 1188 阅读 · 0 评论 -
机器学习基础|K折交叉验证与超参数搜索
文章目录交叉验证交叉验证的概念K的取值为什么要用K折交叉验证Sklearn交叉验证API超参数搜索超参数的概念超参数搜索的概念超参数搜索的原理Sklearn超参数搜索API实例交叉验证交叉验证的概念交叉验证是一种通过估计模型的泛化误差,从而进行模型选择的方法。基本思想是将训练集分为两大部分,一部分数据用来模型的训练,另一部分数据用于测试模型的误差,称为验证集。K折交叉验证需要将数据集分为n等份,其中每一份都要分别作为验证集来进行训练。举个例子,将训练集分为4份,那么这四份中的每一份都要分别作为验证集原创 2021-07-07 15:45:08 · 3710 阅读 · 2 评论 -
机器学习基础|多项式朴素贝叶斯算法及实战
https://www.cnblogs.com/wgwg/p/13367847.html朴素贝叶斯朴素贝叶斯概念朴素贝叶斯法是一种基于贝叶斯定理与特征条件独立假设的分类方法。其中朴素指的就是条件独立 。朴素贝叶斯在分类的时候不是直接返回分类,而是返回属于某个分类的概率。例如对文章的类别进行判断:计算出的是每篇文章属于某个类别的概率,哪个类别占的比例比较大,则将文章归为哪一类。简单地说,朴素贝叶斯是根据概率的大小进行分类。概率的计算朴素贝叶斯需要用到一些概率知识,即联合概率和条件概率。联合原创 2021-07-05 15:49:09 · 5163 阅读 · 0 评论 -
机器学习基础|K近邻算法及实战
K近邻算法K近邻算法(KNN)概念KNN最早是由Cover和Hart提出的一种分类算法。其定义为:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。举个例子下图中需要判断绿色圆圈的类别。原始数据有两个类别,分别为蓝色方框和红色三角。下面用KNN法对绿色圆圈进行分类。K=3原创 2021-07-01 16:38:37 · 859 阅读 · 0 评论 -
机器学习基础|数据的降维及实战
降维指的是:数据的降维是数据预处理中至关重要的一部分。维度指的是特征的维度。所以降维指的是特征的数量减少。举个例子。有些特征是没有用的,比如皮肤数据的降维方式有两种特征选择主成分分析特征选择特征选择是什么特征选择就是单纯的从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值、也不改变值,但是选择后的特征维数肯定比选择前小,毕竟我们只选择了其中的一部分特征。为什么要进行特征选择当数据的特征较多时,特征量达到成百上千时,会极大的消耗计算性能。并且,有许多无用的特原创 2021-06-28 20:34:58 · 1868 阅读 · 6 评论 -
机器学习基础|特征工程
数据预处理缺失值填补数据归一化数据类型:二维数据数据标准化特征工程字典特征数据提取文本特征数据提取tf-dif相关sklearn函数原创 2021-06-26 15:25:44 · 3135 阅读 · 4 评论 -
神经网络基础详解
神经网络基础1、感知机:计算机模拟大脑经行信息处理的过程。有n个输入数据,通过权重与各数据之间的计算和,比较激活函数结果,得出输出。解决分类问题。http://playground.tensorflow.org原创 2020-11-08 20:18:19 · 7185 阅读 · 8 评论 -
卷积神经网络详解
深度神经网络的发展。为什么要引进卷积神经网络?全连接神经网络的缺点参数太多,手写识别数字的数据集中,只有28*28,就会有7840个权重,那要是有彩色的、更大的图片,就需要更多的权重,完全是浪费。层数限制:一味的增加层数反倒可能不如一层效果好,因为没有提炼到图像的重点。神经网络基本组成包括输入层、隐藏层、输出层。而神经网络的特点在于隐藏层分为卷积层和池化层。卷积层:通过在原始图像上平移来提取特征。池化层:通过特征后稀疏参数来减少学习的参数,降低网络的复杂度。...原创 2020-11-08 17:33:12 · 758 阅读 · 0 评论 -
Anaconda安装OCR——Python tesseract is not installed or it’s not in your path
未安装OCR使用 pytesseract.image_to_string() 函数时,会报错:Python tesseract is not installed or it’s not in your path下面说一下安装过程:首先下载Tesseract-OCR然后双击,接下来点击Next->Next->Next->Next接下来找到安装的路径路径可以自己定,需要记住,一会还要用,比如我的路径为:'C:/Users/18256/.conda/envs/Xgboost原创 2020-08-05 16:50:47 · 12738 阅读 · 1 评论 -
tensorflow入门2
张量的基本操作创建为0的张量tf.zeros(shape,dtype=tf.float32,name=None)创建一个3行4列的0张量:a=tf.zeros([3,4],dtype=tf.float32)with tf.Session() as sess: print(sess.run(a))[[0. 0. 0. 0.][0. 0. 0. 0.][0. 0. 0. 0.]]创建为1的张量tf.ones(shape,dtype=tf.float32,name=None)原创 2020-07-12 15:41:53 · 145 阅读 · 0 评论 -
tensorflow入门1
tensorflow的组成先来看一个例子,比如我们实现一个简单的加法:按照python常规的思路,我们可能会先定义一个a,定义一个b,然后add。import tensorflow as tfimport numpy as npa=tf.constant(1)b=tf.constant(2)y=tf.add(a,b)print(y)结果:Tensor(“Add:0”, shape=(), dtype=int32)我们可以看到,显示的结果并不是3,而是一个Tensor(……),这是原创 2020-07-07 16:56:50 · 236 阅读 · 0 评论 -
pandas
Pandas是Python第三方库,提供高性能易用数据类型和分析工具,其经常使用的操作如下:1、数据的读取与基本操作pandas库的导入方式一般为import pandas as pd导入CSV或者xlsx文件:data = pd.read_csv('文件路径+name.csv') #如果把代码和数据放入同一文件夹中,只需要输入文件名即可。data = pd.read_excel(...原创 2019-02-03 15:17:03 · 257 阅读 · 0 评论 -
网络爬虫-re库-正则表达式
正则表达式语法正则表达式语法由字符和操作符组成。re.match()re.match尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功,match就返回none1、常规匹配content="yangkezhenshuai 888 666 shuai"result=re.match('^yangkezhenshuai\s\d\d\d\s\d{3}\s.*',content)#...原创 2019-02-14 19:28:04 · 701 阅读 · 0 评论 -
基于贝叶斯算法的拼写检查器
原理拼写检查器是:给定一个单词, 如果单词是拼写错误的,我们的任务是选择和它最相似的拼写正确的单词。如果这个单词是正确的, 那么就是它自己。当然, 不可能绝对的找到相近的单词, 比如说给定 lates 这个单词, 它应该别更正为 late 呢还是 latest 呢? 这些困难指示我们, 需要使用概率论, 而不是基于规则的判断。所以它的原理就是:给定一个词 w, 在所有正确的拼写词中, 我们想要找...原创 2019-02-08 10:38:42 · 1868 阅读 · 4 评论 -
聚类算法-KMeans&DBSCAN
K-Means与DBSCAN都是常见的聚类算法。K-means1、从n个数据对象中任意选出k个对象作为初始的聚类中心;2、计算剩余的各个对象到聚类中心的距离,将它划分给最近的簇;3、重新计算每一簇的平均值(中心对象);4、循环多次直到每个聚类不再发生变化为止。K-Means需要确定参数要分成的簇数K。DBSCAN1、 核心点:这些点在基于密度的簇内部。点的邻域由距离函数和用户指定...原创 2019-02-16 10:35:17 · 2951 阅读 · 0 评论 -
基于贝叶斯算法的新闻分类器
文本主题分类器对文本进行分析、分类是贝叶斯最擅长的应用场景之一,对于不同主题的文本,我们可以用贝叶斯训练一个分类器,然后将其应用在新数据上,预测主题类型。本文主要介绍一下利用贝叶斯对文本进行分类。需要用到的函数主要用两个函数来实现文本特征的提取CountVectorizer 和 TfidfVectorizerCountVectorizer:只考虑词汇在文本中出现的频率TfidfVec...原创 2019-02-09 16:40:50 · 2374 阅读 · 0 评论 -
支持向量机
好歹是个的环境原创 2019-02-12 10:52:13 · 41307 阅读 · 6 评论 -
sklearn实现支持向量机
需要用到的函数sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)n_samples: 待生成的样本的总数。centers: 要生成的样本中心(类别)数,或者...原创 2019-02-12 14:22:43 · 12219 阅读 · 1 评论 -
基于K-Means算法的图像压缩
有些数字图像的数据量是非常大的,这无疑对图像的存储、处理和传送带来很大的困难,所以要用到图像压缩。在这里用K-Means算法实现了一个简单的图像压缩。K-Means原理1 随机选取k个中心点(把数据分成n类)2 遍历所有数据,将每个数据划分到最近的中心点(质心)3 计算每个聚类的平均值,并作为新的质心4 重复多次,直到这k个中线点不再变化(收敛了),或执行了足够多的迭代。代码我选取了...原创 2019-02-13 16:41:17 · 1131 阅读 · 0 评论 -
Anaconda安装Pyecharts
1、官网下载安装包Pyecharts2、将压缩包解压到Anaconda3的pkgs目录下3、打开Anaconda Prompt,输入cd anaconda3/pkgs进入文件夹4、输入pip install pyecharts-0.1.9.4-py2.py3-none-any.whl即可安装成功...原创 2019-03-09 09:19:01 · 13694 阅读 · 3 评论 -
jupyter notebook配置Tensorflow环境(windows系统)
1、创建Tensorflow环境conda create -n tensorfolw python=3.6添加环境为命令为:conda creat --name myenv python=xx(环境名称,这里因为创建tensorflow环境,所以我直接命名的tensorflow,python=3.6指的是我在python3.6环境下创造的)2、安装CPU版本的tensorflowpi...原创 2019-07-31 11:03:48 · 6630 阅读 · 4 评论