自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 机器学习经典算法---支持向量机SVM

文章目录一、简介二、支持向量机原理1、间隔最大化和支持向量2、线性可分支持向量机原理推导对偶问题3、非线性支持向量机和核函数4、线性支持向量机(软间隔支持向量机)与松弛变量1、软间隔2、对偶问题三、SVM优缺点四、参考:一、简介支持向量机(support vector machines)是一种二分类模型,它的目的是寻找一个超平面来对样本进行分割,分割的原则是间隔最大化,最终转化为一个凸二次规划...

2020-05-01 23:44:33 852

原创 机器学习经典算法---EM算法(一文秒懂极大释然估计和EM算法)

目录极大似然估计1.明确极大似然函数的目的2、通俗体现极大似然估计思想的例子案例一:案例二:总结:问题引入E步与M步参考:极大似然估计1.明确极大似然函数的目的随机变量的概率分布往往由少量的参数定义(也叫做有效统计量)只要计算出这些参数我们就确定了这个分布的情况极大似然估计就是用来估计这个参数的例如:二项分布:P(x)仅由由一个参数p决定,极大似然估计就要估计p正态分布:...

2020-04-26 23:36:22 1529

原创 机器学习经典算法---线性回归(Linear Regression)算法

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...

2020-04-21 18:41:39 22106 2

原创 解决windows中的WSL Ubuntu子系统忘记root密码和用户密码问题

4、运行如下命令wsl.exe -d Ubuntu-22.04 --user root,命令中ubuntu-22.04是子系统的版本名,来自上面查询的结果,这里需要根据你查寻的结果进行替换。3、运行 wslconfig /l 命令查看子系统版本。5、运行passwd root 修改 root 密码。这里看到我的子系统名称为ubuntu-22.04。

2024-05-05 22:24:34 3027 1

原创 解决windows中的WS Llinux子系统(unbantu2204)访问网络失败问题?

解决虚拟机网络连接异常

2024-05-05 15:24:21 485 1

原创 动手学大模型LLM应用开发之个人知识库助手项目

本项目由datawhale成员开发,主要实现了基于 Datawhale 的现有项目 README 的知识问答,使用户可以快速了解 Datawhale 现有项目情况。

2024-04-29 00:11:25 1049

原创 如何防止pip用本地缓存去安装第三方包?

python 环境安装

2024-04-23 00:36:59 290

原创 动手学大模型LLM应用开发之提示词工程(Prompt Engineering)

提示工程(Prompt Engineering)是一个相对较新的研究方向,用于研究如何编写和优化提示池,以便更好、更有效地使用大语言模型。我们每一次访问大模型,给模型的输入就是 Prompt,大模型给我们的返回结果我们称之为 Completion。

2024-04-18 22:23:15 2978

原创 动手学大模型LLM应用开发之大模型初探

大语言模型(LLM,Large Language Model),是一种可以理解和生成人类语言的人工智能模型。它们通过海量的文本数据进行训练,从而获得对语言深层次的理解能力。LLM 通常指包含数百亿(或更多)参数的语言模型。国外的知名 LLM 有 GPT-3.5、GPT-4、PaLM、Claude 和 LLaMA 等。国内的有文心一言、讯飞星火、通义千问、ChatGLM、百川等。

2024-04-18 01:09:05 1028

原创 Docker提交天池比赛代码流程(windows10环境下)

一、Docker环境配置(以windows10为例)Docker Desktop 下载地址:https://docs.docker.com/docker-for-windows/install/1、打开powershell输入如下命令(可直接一起复制粘贴),查看自己的电脑版本和buildnumberGet-WmiObject -Class Win32_OperatingSystem | % CaptionGet-WmiObject -Class Win32_OperatingSystem | %

2021-02-20 22:50:43 1645

原创 如何解决win+r键输入cmd后cmd窗口后没有反应、没有显示的问题

现象描述win+r 输入cmd后窗口为黑乎乎的没有任何显示解决办法一、在cmd空白窗口右击选则属性二、点击终端设置,取消终端颜色的勾选三、大功告成!!!

2021-01-13 15:35:27 5860 2

原创 动手学数据分析task1打卡

**复习:**这门课程得主要目的是通过真实的数据,以实战的方式了解数据分析的流程和熟悉数据分析python的基本操作。知道了课程的目的之后,我们接下来我们要正式的开始数据分析的实战教学,完成kaggle上泰坦尼克的任务,实战数据分析全流程。这里有两份资料:教材《Python for Data Analysis》和 baidu.com &google.com(善用搜索引擎)1 第一章:数据载入及初步观察1.1 载入数据数据集下载 https://www.kaggle.com/c/titan

2020-08-19 23:20:45 357

原创 离线安装opencv_python-3.4.1.15-cp36-cp36m-win_amd64报错解决办法

问题描述:安装opencv_python-3.4.15 出现报错ERROR: opencv_python-3.4.1.15-cp36-cp36m-win_amd64(1).whl is not a supported wheel on this platform解决方案:看了这篇博客他的解决方案是:首先查看pip支持的哪些符号,运行如下命令:1、amd64:cpu是x64的,(注意并不是指操作系统是64位的)用如下代码查看import pip._internalprint(pip._inte

2020-07-19 19:19:10 9345 11

原创 零基础入门cv赛事街道字符识别----Task5模型集成

Datawhale 零基础入门CV赛事-Task5 模型集成文章目录Datawhale 零基础入门CV赛事-Task5 模型集成5 模型集成5.1 学习目标5.2 集成学习方法5.3 深度学习中的集成学习5.3.1 Dropout5.3.2 TTA5.3.3 Snapshot5.4 结果后处理5.5 本章小节参考在上一章我们学习了如何构建验证集,如何训练和验证。本章作为本次赛题学习的最后一章,将会讲解如何使用集成学习提高预测精度。5 模型集成本章讲解的知识点包括:集成学习方法、深度学习中的集成学习和

2020-06-02 22:29:07 197

原创 零基础入门cv赛事街道字符识别----Task4模型训练与验证

文章目录4 模型训练与验证4.1 学习目标4.2 构造验证集训练集(Train Set):模型用于训练和调整模型参数;验证集(Validation Set):用来验证模型精度和调整模型超参数;测试集(Test Set):验证模型的泛化能力。留出法(Hold-Out)交叉验证法(Cross Validation,CV)自助采样法(BootStrap)4.3 模型训练与验证4.4 模型保存与加载4.5 模型调参流程4.6 本章小节参考在上一章节我们构建了一个简单的CNN进行训练,并可视化了训练过程中的误差损失

2020-05-30 21:25:42 299 1

原创 零基础入门cv赛事街道字符识别----Task3构建字符识别模型 (卷积神经网络 Convolutional Neural Network, CNN)

在前面的章节,我们讲解了赛题的背景知识和赛题数据的读取。本章开始构建一个字符识别模型,基于对赛题理解本章将构建一个定长多字符分类模型。3 字符识别模型本章将会讲解卷积神经网络(Convolutional Neural Network, CNN)的常见层,并从头搭建一个字符识别模型。3.1 学习目标学习CNN基础和原理使用Pytorch框架构建CNN模型,并完成训练3.2 CNN介绍卷积神经网络(简称CNN)是一类特殊的人工神经网络,是深度学习中重要的一个分支。CNN在很多领域都表现优异,精

2020-05-26 22:46:52 203

原创 零基础入门cv赛事街道字符识别----Task2数据读取与数据扩增

文章目录数据读取与数据扩增1.学习目标2.图像读取2.1 Pillow2.2 OpenCV3.数据扩增方法3.1 数据扩增介绍数据扩增为什么有用?有哪些数据扩增方法?3.2 常见的数据扩增方法3.3 常用的数据扩增库torchvisionimgaugalbumentations4.Pytorch读取数据4.1 代码补充解释5 本章小节参考在上一章节,我们给大家讲解了赛题的内容和三种不同的解决方案。从本章开始我们将逐渐的学习使用【定长字符识别】思路来构建模型,逐步讲解赛题的解决方案和相应知识点。数据读取与

2020-05-23 17:50:32 405 1

原创 零基础入门CV之街道字符识别----Task1赛题的理解

Datawhale 零基础入门CV赛事-Task1 赛题理解本章内容将会对街景字符识别赛题进行赛题背景讲解,对赛题数据的读取进行说明,并给出集中解题思路。1 赛题理解赛题名称:零基础入门CV之街道字符识别赛题地址:零基础入门CV赛事- 街景字符编码识别赛题目标:通过这道赛题可以引导大家走入计算机视觉的世界,主要针对竞赛选手上手视觉赛题,提高对数据建模能力。赛题任务:赛题以计算机视觉中字符识别为背景,要求选手预测街道字符编码,这是一个典型的字符识别问题。为了简化赛题难度,赛题数据采用公开数据集

2020-05-20 21:51:19 283 1

原创 机器学习算法---条件随机场(Conditional Random Field,CRF)

目录为什么要引入条件随机场(CRF)?马尔科夫过程定义隐马尔科夫算法定义CRF的定义(以线性链条件随机场为例)参数化形式实现条件随机场预测问题的维特比算法参考为什么要引入条件随机场(CRF)?假设你有许多小明同学一天内不同时段的照片,从小明提裤子起床到脱裤子睡觉各个时间段都有(小明是照片控!)。现在的任务是对这些照片进行分类。比如有的照片是吃饭,那就给它打上吃饭的标签;有的照片是跑步时拍的,那...

2020-04-29 20:06:08 379

原创 机器学习经典算法---贝叶斯公式( bayes)

目录相关概念先验概率和后验概率贝叶斯决策理论贝叶斯公式朴素贝叶斯分类器5. 极值问题情况下的每个类的分类概率6. 下溢问题如何解决7. 零概率问题如何解决?相关概念先验概率和后验概率摘自百度百科:先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现.后验概率是指依据得到"结果"信息所计算出的最有可能是那种事件发生,如贝叶斯公式中的,是"执果寻因...

2020-04-23 22:06:13 3101

原创 模型融合

文章目录1.Voting2.Averaging3.Ranking4.Bagging5.BoostingBagging和Boosting算法的区别:6.Stacking(1) 什么是 stacking(2) 如何进行 stacking1.Voting投票法针对分类模型,多个模型的分类结果进行投票,少数服从多数。除了公平投票外,还可以给投票设置权重,分类器效果越好权重越高,分类器效果越差,权重越低...

2020-04-04 21:45:28 327

原创 数据建模调参

数据建模调参1、模型性能验证:交叉验证方法曲线验证模型效果2、模型调参:贪心调参方法网格调参方法贝叶斯调参方法1、模型性能验证:交叉验证方法贴一张原理图(以10折交叉验证为例)k折交叉验证步骤:Step 1:使用不重复抽样将原始数据随机分为k份;Step 2:其中k-1份数据用于模型训练,剩下的那1份数据用于测试模型;Step 3:重复Step 2 k次,得到k个模型和他的评估结果...

2020-04-01 21:51:53 592

原创 特征工程

业界流传:数据和特征决定了机器学习的上限,而算法和模型只是在逼近这个上限而已。特征工程是什么?特征工程:就是一项工程活动,最大限度地从原始数据中提取特征以供算法和模型使用。说白了,就是将自己获得的数据转换为算法需要的形式。如何理解这句话呢?比如数据有缺失,可以进行缺失值处理;对不属于同一量纲的数据,可以进行归一化和标准化;对于多个特征值,可以特征选择或者PCA降维,减少无用的特征等等,这将使得...

2020-03-28 21:52:57 200

原创 数据分析常用库总结

EDA-数据探索性分析¶赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.122819

2020-03-24 20:22:47 1400

原创 《动手学深度学习》pytorch版(第三次打卡)

cv方向一、目标检测基础1.目标检测和边界框%matplotlib inlinefrom PIL import Imageimport syssys.path.append('/home/kesci/input/')import d2lzh1981 as d2l# 展示用于目标检测的图d2l.set_figsize()img = Image.open('/home/kesci...

2020-02-25 18:32:46 629 1

原创 《动手学深度学习》pytorch版(第二次打卡)

一、 过拟合、欠拟合及其解决方案1.过拟合、欠拟合的概念2.权重衰减3.丢弃法模型选择、过拟合和欠拟合训练误差和泛化误差在解释上述现象之前,我们需要区分训练误差(training error)和泛化误差(generalization error)。通俗来讲,前者指模型在训练数据集上表现出的误差,后者指模型在任意一个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。计...

2020-02-17 23:39:19 491

原创 《动手学深度学习》pytorch版

线性回归主要内容包括:线性回归的基本要素线性回归模型从零开始的实现线性回归模型使用pytorch的简洁实现线性回归的基本要素模型为了简单起见,这里我们假设价格只取决于房屋状况的两个因素,即面积(平方米)和房龄(年)。接下来我们希望探索价格与这两个因素的具体关系。线性回归假设输出与各个输入之间是线性关系:price=warea⋅area+wage⋅age+bprice=warea⋅...

2020-02-14 21:52:20 263

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除