机器学习
文章平均质量分 62
机器学习
古月哥欠666
这个作者很懒,什么都没留下…
展开
-
快速为 AI 模型生成 Demo--gradio-app
GitHub 上的开源项目,可以在浏览器中进行项目演示。你可以完成拖拽上传图像、粘贴文本、声音录制等操作,并查看模型输出内容。环境准备要求是python3.7+,实际检测py3.7不可以py3.8可以可以用conda创建一个python3.8虚拟环境,方法参考导入gradio包pip install -q gradio实例运行包括上面所说的文本、音频等。这里以文本为演示过程,其它方法可以参考github开源项目有两种方法第一种直接在github项目点击colab notebook原创 2022-05-07 21:01:17 · 2597 阅读 · 3 评论 -
解决module ‘cv2.cv2‘ has no attribute ‘xfeatures2d以及opencv-python和opencv-contrib-python的安装问题
如果你搜了文档也尝试各种方法都不能解决问题的话,那么看到这里该醒悟了首先opencv在4.4.0以后可以使用免费使用sift了,但是我们学习肯定不止于此了,但是很遗憾包括最新版本也不能使用surf如果你学习的是c或者c++语言,相信你可能已经在网上找了大神关于cmake以及vs等编译方法,但是我学的是python啊按照他们的方法都试了,结果依然不行后来一想花那么长时间配置环境,还不如新建个虚拟环境将opencv降低版本不就好了吗抱着这样的心态尝试了opencv各种版本,我去有的网友可以有的不可以,我原创 2022-04-26 23:23:32 · 5513 阅读 · 0 评论 -
机器学习sklearn中独热编码与向量计数的应用
独热编码类别特征原数据特征特征列表独热编码转换后数据特征文本特征原数据特征特征列表独热编码转换后数据特征代码独热编码主要是对一些非数字的文本进行类别表示,便于计算机进行计算与分类常见的有类别特征(包含文本的类别变量)和纯粹的文本特征独热编码是对类别特征或者文本特征创建不重复的列表,对数据中出现的类别特征或者文本特征分别按照列表中特征顺序进行0,1赋值,可以这样理解,假设一开始列表中特征都设为0,每个特征的独热编码就是对出现的特征赋值1类别特征比如数据中除了包含年龄等数字还有人的名字等类别特征,无法原创 2022-04-25 17:22:08 · 1791 阅读 · 0 评论 -
机器学习opencv对分类-回归算法的应用
机器学习对分类与回归评分指标不同在sklearn中评分函数score相当于calcError(评价模型的类函数),fit(拟合函数)相当于train(训练函数)常见的评分指标都在sklearn.metrics里这里写目录标题分类指标准确率精确率召回率回归指标均方误差(mse)可释误差R2R^{2}R2分类模型输出结果回归模型输出结果分类指标准确率from sklearn import metricsmetrics.accuracy_score(y_true, y_pred)精确率from原创 2022-04-24 22:28:40 · 3001 阅读 · 0 评论 -
sklearn.datasets数据集和下载网站
sklearn.datasets包包含的数据集有:load_boston:波士顿数据集load_iris :鸢尾花数据集load_diabetes :糖尿病数据集load_digits :数字数据集load_linnerud : 生理指标数据集fetch_olivetti_face :人脸数据集fetch_20newsgroups : 新闻组数据集等下载方式:1.从sklearn.datasets包里下载例如from sklearn import datasetsimport m原创 2022-04-23 23:41:30 · 5199 阅读 · 0 评论 -
关于jupyter notebook与jupyter lab的使用
jupyter notebook与jupyter labJupyter Notebook是用于创建Jupyter Notebook文档的基于Web的交互式计算环境。它支持多种语言,例如Python(IPython),Julia,R等,并且广泛用于数据分析,数据可视化以及进一步的交互式探索性计算。JupyterLab是包括笔记本在内的下一代用户界面。它具有模块化的结构,您可以在同一窗口中打开多个笔记本或文件(例如HTML,Text,Markdowns等)作为选项卡。它提供了更多类似于IDE的体验。解决:原创 2022-04-23 20:35:26 · 1171 阅读 · 0 评论 -
利用conda创建虚拟环境、pip导出环境与项目依赖包
首先查看已经存在的虚拟环境conda env list或者conda info -econda创建虚拟环境conda create --环境名 python=版本号#这里不需要预先建立环境名文件夹,它会自动在conda包里的envs文件下建立对应的虚拟环境激活或者切换虚拟环境每次使用时先在anaconda prompt端口或者命令行激活环境,也可以切换到不同环境下,然后再进行一系列其它操作activate 环境名重命名环境名conda没有直接重命名环境名的方法,可以曲线解决,原创 2022-04-23 14:01:20 · 2910 阅读 · 0 评论 -
机器学习python实践——魏贞原
书籍pdf https://pan.baidu.com/s/1uERm5XdlcD6hibhfQQNeYQ?pwd=qzpz书籍代码 机器学习python实践选择模型评估算法方法评估算法指标分类算法矩阵回归算法矩阵选择模型评估算法方法方法一:将数据集分离训练集与评估数据集from pandas import read_csvfrom numpy import set_printoptionsfrom sklearn.feature_selection import SelectKBest,原创 2022-04-22 23:53:47 · 906 阅读 · 2 评论 -
利用git获取github代码
这里写目录标题利用git获取github代码下载Git软件命令行获取利用git获取github代码获取github代码可以通过直接下载zip包,或者通过Git软件通过命令行获取相应的代码,git获取代码的好处是,如果github上的仓库代码修改时,也可以通过命令对本地已经下载的代码进行更新,不需要重新下载,而且从本地上传代码也方便下载Git软件下载链接https://git-scm.com/downloads命令行获取以下是window系统获取方法1.通过cmd进入命令行 快捷键(win+R原创 2022-04-22 23:36:07 · 3856 阅读 · 0 评论 -
数据预处理方法
对于pytorch框架来说数据预处理可以使用transforms函数from torchvision import datasets, transformspipline_train = transforms.Compose([ #随机旋转图片 transforms.RandomHorizontalFlip(), #将图片尺寸resize到32x32 transforms.Resize((32,32)), #将图片转化为Tensor格式 transfor原创 2022-01-03 23:33:11 · 2134 阅读 · 0 评论 -
cross_val_score的用法
cross_val_score交叉验证既可以解决数据集的数据量不够大问题,也可以解决参数调优的问题。这块主要有三种方式:简单交叉验证(HoldOut检验)、cv(k-fold交叉验证)、自助法。交叉验证优点:1:交叉验证用于评估模型的预测性能,尤其是训练好的模型在新数据上的表现,可以在一定程度上减小过拟合。2:还可以从有限的数据中获取尽可能多的有效信息。常用的是k折交叉验证方法,其流程为:1、首先,将全部样本划分成k个大小相等的样本子集;2、依次遍历这k个子集,每次把当前子集作为验证集,其余原创 2021-12-05 21:55:13 · 42790 阅读 · 3 评论 -
机器学习中的判别式模型和生成式模型
机器学习中的判别式模型和生成式模型转载 2021-11-25 16:54:17 · 84 阅读 · 0 评论 -
基于opencv的情绪检测
传统的情绪检测是用级联检测器来实现,也可以通过卷积网络训练模型来实现。为了可以很好的进行图像预测,首先需要进行模型的训练1.导入模块from __future__ import print_functionimport kerasfrom keras.preprocessing.image import ImageDataGeneratorfrom keras.models import Sequentialfrom keras.layers import Dense,Dropout,Acti原创 2021-10-09 18:34:32 · 1672 阅读 · 1 评论 -
基于opencv的人脸、眼睛、鼻子、微笑识别
对于眼睛、鼻子等识别需要首先进行opencv人脸识别,这样减少计算量主要步骤如下:1.导入级联检测器,一般下载cv2会自带一些xml文件,除了mouth、nose需要另外下载然后放到D:\miniconda\Lib\site-packages\cv2\data文件夹下,下载地址2.导入图片或者摄像头3.利用face_cascade.detectMultiScale函数找到对应检测的坐标4.进行检测区域的画框主要代码为:import cv2face_cascade = cv2.Cascade原创 2021-10-08 18:02:56 · 1769 阅读 · 0 评论 -
opencv实战项目:基于opencv的车牌号码识别
首先,呈上我自己根据代码写的步骤流程,方便记忆,字有点丑,哈哈哈!!!好吧,图片看不清,那就上代码import cv2import imutilsimport numpy as npimport pytesseractpytesseract.pytesseract.tesseract_cmd = r'D:\Program Files\Tesseract-OCR\tesseract.exe'img = cv2.imread('D:/skoda1.png',cv2.IMREAD_COLOR)原创 2021-09-28 16:23:47 · 805 阅读 · 0 评论 -
机器学习的学习经验总结!
机器学习算法部分编程实践部分机器学习的知识体系学习资料链接:钥匙书(机器学习理论导引补充):https://github.com/datawhalechina/key-book南瓜书(周志华西瓜书详细解读补充):https://github.com/datawhalechina/pumpkin-bookEasy-RL(深度强化学习教程):https://github.com/datawhalechina/easy-rlLeeML-Notes(李宏毅老师-机器学习课程笔记):https:/原创 2021-09-16 16:06:24 · 81 阅读 · 0 评论 -
机器学习领域必知必会的12种概率分布
总体概率分布图关系如下:均匀分布(连续型)(alpha=1、 beta=1 的Beta分布)→\rightarrow→Beta 分布(连续型)→\rightarrow→狄利克雷分布(连续型)(Beta 分布高维情形的推广)由1次到N次的独立重复实验{伯努利分布(离散型)→→二项分布(离散型)Multi−Bernoulli分布(离散型)→→多项式分布(离散型)\left\{\begin{matrix} 伯努利分布(离散型)\rightarrow→二项分布(离散型) \\Multi-Bernoulli原创 2021-09-16 15:49:32 · 387 阅读 · 0 评论 -
文档扫描OCR识别的安装
步骤先下载tesseract,选择一个版本即可tesseract地址如果C盘有限,可以将默认的地址C盘改为D盘即可例如:D:\Program Files \Tesseract-OCRwindow中命令行运行1.如果需要在window命令行中运行,需要配置环境变量在用户变量和系统变量的path中,都新增一个tesseract的路径,该路径为上面的安装路径。2.通过在命令行输入tesseract -v,若得到相应版本信息则配置成功。3.测试图片,cd到图片所在位置,用 tesseract原创 2021-08-29 18:26:46 · 631 阅读 · 0 评论 -
朴素贝叶斯——机器学习总结
朴素贝叶斯基础知识概念优缺点一般过程利用python进行文本分类准备数据基础知识概念从简单的概率分类器开始,给出一些假设(条件独立性)学习朴素贝叶斯分类器。“朴素“意味最原始、最简单的假设。优缺点优点:在数据较少的情况下仍然有效,可以处理多类别问题。缺点:对输入数据的准备方式(数据的关联性)比较敏感。适用数据类型:标称型数据注:标称型:一般在有限的数据中取,而且只存在‘是’和‘否’两种不同的结果(一般用于分类) 数值型:可以在无限的数据中取,而且数值比较具体化,例如4.02,6.23这种值原创 2021-05-08 17:42:25 · 468 阅读 · 0 评论