自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(139)
  • 收藏
  • 关注

原创 CV Task2 打卡

掌握图像几何变换(平移、旋转)的原理https://blog.csdn.net/u012421852/article/details/79463529https://www.cnblogs.com/wangguchangqing/p/4039095.htmlhttps://blog.csdn.net/ruohua3kou/article/details/88766750https:...

2020-04-23 22:58:26 134

原创 机器学习Task2 朴素贝叶斯

1.生成模型:https://www.cnblogs.com/xumaomao/articles/11042390.html2.判别模型:https://www.cnblogs.com/jerrylead/archive/2011/03/05/1971903.htmlhttps://blog.csdn.net/wcqlwyt/article/details/812690773....

2020-04-23 22:54:34 200 1

原创 Jupyter 如何使用 args = parser.parse_args()

最近在女朋友的催促下,啃代码啃得脑壳疼遇到了一个问题:python文件里面的参数不能直接在jupyter中使用,放在jupyter中的时候就会报错,如下所示:parser = argparse.ArgumentParser() parser.add_argument('--GPU', type=int, default=0, help='GPU to use[default : GPU 0]')parser.add_argument('--model', default='pointnet_

2021-08-25 10:27:40 4217 1

原创 NLTK: [Error:11004] getaddrinfo failed

当我运行nltk的词分割时:from nltk.tokenize import word_tokenizetext = "God is Great! I won a lottery."print(word_tokenize(text))出现了缺少punkt包,于是采用如下代码下载:import nltknltk.download()报错[Error:11004] getaddrinfo failed解决方法:1.打开查询IP地址的网址:https://www.ipad.

2021-08-18 10:43:38 515

原创 数据挖掘顶级比赛---综合整理

整理所有可以参加的数据挖掘顶级比赛1.DrivenData:https://www.drivendata.org/2.CrowdANALYTIX: https://www.crowdanalytix.com/#solutionscommunity https://www.crowdanalytix.com/community3.InnoCentive https://www.innocentive.com/our-solvers4.Codalab https://competitions.c

2021-04-23 16:12:14 1016

原创 ipykernel_launcher.py: error: unrecognized arguments:

args = parser.parse_args()引发的错误:usage: ipykernel_launcher.py [-h] [--data_path DATA_PATH] [--dataset DATASET]ipykernel_launcher.py: error: unrecognized arguments: -f C:\Users\hp\AppData\Roaming\jupyter\runtime\kernel-0701c135-8f2b-4af6-8cf1-bae93d.

2021-04-07 17:09:27 4482 1

原创 2020-11-29

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档Linux操作指令大全前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结操作指令1. 复制文件或目录:cp [-adfilprsu] 来源文档(source) 目标文档(destination)具体参数含义:https://www.runoob.com/linux/linux-file-content-manage.html2.移除文件或目录:r...

2020-11-29 19:13:51 163

原创 刷题

小李刷题日记记录每天刷题学到的东西717.1比特2比特功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入记录每天刷题学到的东西刷题网站Leetcode,也不知道从什么题目开始刷,也忘了语法的基础知识,也不太得记得常用的数据结构,但

2020-11-20 11:20:00 372

原创 Latex 横向点,竖向点,斜着点

LaTeX输入单个点:\cdot横向多个点:\cdots竖向多个点:\vdots斜向多个点:\ddots

2020-08-08 11:17:49 6177

原创 深度学习打卡作业

分析前馈神经网络、卷积神经网络和循环神经网络的异同点。前馈神经网络常规前馈神经网络(FNN)。该网络不考虑输入数据可能具备的任何特定结构。尽管如此,它仍是非常强大的机器学习工具,尤其是与先进的正则化技术一起使用时。这些技术(稍后将会介绍)帮助解决人们处理「深度」网络时遇到的训练问题:神经网络有大量隐藏层,隐藏层非常难以训练(梯度消失和过拟合问题)。前馈神经网络架构FNN 由一个...

2020-05-05 23:44:57 1223

原创 Spectral Clustering by Joint Spectral Embedding and Spectral Rotation

The existing joint model adoptsan orthonormal real matrix to approximate the orthogonal butnonorthonormal cluster indicator matrix. It is noted that onlyin a very special case (i.e., all clusters have the same number of samples), the cluster indicator

2020-05-03 17:02:25 634 2

原创 谱聚类的数学解释

1.什么是拉普拉斯矩阵L=D-W其中D是度矩阵,(有的论文称这能代表节点的显著性程度,即节点的度越大,说明该节点在图中的显著性越大),只在主对角线上面有值,在其余位置都是0。W是通过样本点构建的基于全连接的相似度矩阵,那么L是一个什么样的矩阵的?主对角线上是每一行的权重之和,即最大的值,其余位置都是任意两个节点之间的负相似度。拉普拉斯矩阵的最大价值是把一个抽象的图分隔问题(聚类问题),...

2020-05-03 15:27:35 660

原创 CV Task6

Datawhale 计算机视觉基础-图像处理(上)- Task06 边缘检测6.1 简介6.1.1 什么是边缘?边缘是图像强度函数快速变化的地方6.1.2 如何检测边缘?为了检测边缘,我们需要检测图像中的不连续性,可以使用导数来检测不连续性。如上图所示,上图的第一幅图表示一张数字图片,我们对水平红线处进行求导,便可得到上图二中的关系,可以看到在边缘处有着较大的跳变。但...

2020-05-01 17:29:30 148

原创 cv Task5

图像分割/二值化Datawhale 计算机视觉基础-图像处理(上)-Task05 图像分割/二值化5.1 简介该部分的学习内容是对经典的阈值分割算法进行回顾,图像阈值化分割是一种传统的最常用的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术。它特别适用于目标和背景占据不同灰度级范围的图像。它不仅可以极大的压缩数据量,而且也大大简化了分析和处理...

2020-04-29 21:40:56 196

原创 机器学习 Task5

SVM支持向量机(SVM)——原理篇https://zhuanlan.zhihu.com/p/31886934svm知乎话题https://www.zhihu.com/topic/19583524/top-answers学习SVM,这篇文章就够了!(附详细代码)https://www.jiqizhixin.com/articles/2018-10-17-20机器学习算法...

2020-04-29 21:38:05 307

原创 CV Task4

4.1 简介图像的实质是一种二维信号,滤波是信号处理中的一个重要概念。在图像处理中,滤波是一种非常常见的技术,它们的原理非常简单,但是其思想却十分值得借鉴,滤波是很多图像算法的前置步骤或基础,掌握图像滤波对理解卷积神经网络也有一定帮助。4.2 学习目标 了解图像滤波的分类和基本概念 理解均值滤波/方框滤波、高斯滤波的原理 掌握OpenCV框架下滤波API的使用 ...

2020-04-27 22:26:00 134

原创 机器学习 Task4

条件随机场相关链接如何直观地理解条件随机场,并通过PyTorch简单地实现https://baijiahao.baidu.com/s?id=1600510002841663634&wfr=spider&for=pc条件随机场(CRF)https://blog.csdn.net/Scythe666/article/details/82021692如何轻松愉快地...

2020-04-27 22:23:35 154

原创 爬虫 Task 4

大作业:爬取腾讯新闻了解ajax加载 通过chrome的开发者工具,监控网络请求,并分析 用selenium完成爬虫 具体流程如下: 用selenium爬取https://news.qq.com/的热点精选import timefrom selenium import webdriverfrom bs4 import BeautifulSoup# -*- codin...

2020-04-27 22:18:27 119

原创 CV Task3

Datawhale 计算机视觉基础-图像处理(上)-Task03 彩色空间互转3.1 简介图像彩色空间互转在图像处理中应用非常广泛,而且很多算法只对灰度图有效;另外,相比RGB,其他颜色空间(比如HSV、HSI)更具可分离性和可操作性,所以很多图像算法需要将图像从RGB转为其他颜色空间,所以图像彩色互转是十分重要和关键的。3.2 学习目标了解相关颜色空间的基础知识 理解彩色空间互...

2020-04-25 22:20:05 151

原创 EM算法 Task3

学习了EM算法,按照教程实现了EM算法,在下面整理几个EM算法的网站【机器学习基础】EM算法https://blog.csdn.net/u010834867/article/details/90762296你真的了解EM算法吗?https://www.jianshu.com/p/c57ef1508fa7超详细的EM算法理解https://www.cnblogs....

2020-04-25 22:17:25 195 1

原创 爬虫 Task3 打卡

ip代理知识为什么会出现IP被封网站为了防止被爬取,会有反爬机制,对于同一个IP地址的大量同类型的访问,会封锁IP,过一段时间后,才能继续访问如何应对IP被封的问题有几种套路:修改请求头,模拟浏览器(而不是代码去直接访问)去访问 采用代理IP并轮换 设置访问时间间隔如何获取代理IP地址从该网站获取:https://www.xicidaili.com/ inspec...

2020-04-25 21:43:35 167

原创 爬虫 Task 2

bs4、xpath和正则表达式BS4Beautiful Soup 4.4.0 文档:https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/BS4爬虫语法:https://www.jianshu.com/p/9254bdc467b2python BS4的使用https://www.cnblogs.com/gl1573/p...

2020-04-23 22:48:00 143

原创 爬虫Task 1

html等有关知识https://www.runoob.com/html/html-tutorial.htmlapi使用https://www.cnblogs.com/ichunqiu/p/10722523.htmlhttps://zhuanlan.zhihu.com/p/36260167https://www.jianshu.com/p/98f165a32318ht...

2020-04-21 23:54:58 169

原创 图像处理Task1

了解OpenCV的框架组成https://blog.csdn.net/yangxueyangxue/article/details/80772566https://blog.csdn.net/weixin_38621214/article/details/90237362最近邻插值算法https://blog.csdn.net/linqianbi/article/details/7...

2020-04-21 23:49:29 133

原创 机器学习-线性回归 Task one

线性回归的原理参考1.刘建平大神的blog:https://www.cnblogs.com/pinard/p/6004041.html2.周志华西瓜书:https://blog.csdn.net/pxhdky/article/details/82388964线性回归算法求解方法:https://blog.csdn.net/Chenyukuai6625/article/details...

2020-04-21 23:44:32 158

原创 逻辑回归的Python实现

逻辑回归的Python实现利用Python中sklearn包进行逻辑回归分析。3.1提出问题根据已有数据探究“学习时长”与“是否通过考试”之间关系,并建立预测模型。3.2理解数据1、导入包和数据#1.导入包import warningsimport pandas as pdimport numpy as npfrom collections import Order...

2020-04-19 21:17:33 581

原创 深度之眼4.10打卡聚类

K-Means算法的实现首先在Matlab中Kmeans算法有相应的函数-https://www.mathworks.com/help/stats/kmeans.html下面根据原理自己写一份kmeans% 利用K-均值聚类的原理,实现对一组数据的分类。这里以一组二维的点为例。N = 40; % 点的个数X = 10*rand(1,N);Y = 10*rand(1,N); ...

2020-04-10 22:34:50 158

原创 Task5 模型结果融合

5.1 模型融合目标5.2 内容介绍5.3 代码实战5.3.1 模型定义5.3.2 划分数据集进行训练和预测5.3.3 简单加权融和5.3.4 Stacking 融合5.4 经验总结Task5 模型结果融合5.1 模型融合目标对于多种调参完成的模型进行模型融合。完成对于多种模型的融合,提交融合结果并打卡。5.2 内容介绍模型融合是比赛后期一个重要的环节,大体来说有如下的类...

2020-04-03 21:45:13 270

原创 3.31--Task4:建模与调参

Datawhale 零基础入门数据挖掘-Task4 建模调参四、建模与调参Tip:此部分为零基础入门数据挖掘的 Task4 建模调参 部分,带你来了解各种模型以及模型的评价和调参策略,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/introdu...

2020-03-31 21:22:17 326

原创 Datawhale 零基础入门数据挖掘-Task3 特征工程

三、 特征工程目标3.1 特征工程目标对于特征进行进一步分析,并对于数据进行处理完成对于特征工程的分析,并对于数据进行一些图表或者文字总结并打卡。3.2 内容介绍常见的特征工程包括:异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 特征归一化/标准化: 标准化(转换为标准正态分布); 归一...

2020-03-27 23:09:53 103

原创 天池大赛第一次打卡-3.23

一、赛题数据赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏。解读:什么是数据信息脱敏处理?[1]数...

2020-03-21 00:36:44 267

原创 Illustrator画程序框图的技巧-一点点整理

第一步:直线工具画若干条闭合的直线 图1需要注意...

2020-03-03 22:36:01 1702

原创 Windows10 远程连接Ubuntu服务器 使用Jupyter

网上查阅了很多中方法,被端口不停的切换弄得很头痛,以下简单方法,亲自测试有效一.本地电脑访问1.本地终端输入ssh remote_user@remote_host -L8008:localhost:8888#ssh -L 本地地址:本地端口:目的地址:目的端口#本地地址被省略了#其中 remote_user是用户名#remote_host是服务器的名字2.输...

2020-02-12 15:55:33 634

原创 latex常用总结

一行居中输入多个矩阵\centering {\begin{matrix}X=\begin{bmatrix}0 & 1 \\1 & 0\end{bmatrix} & H = \frac{1}{\sqrt{2}}\begin{bmatrix}1 & 1 \\1 & -1\end{bmatrix...

2019-10-13 15:15:48 456

原创 ADMM深入理解并在论文里面应用

ADMM和ALM的区别https://blog.csdn.net/shanglianlm/article/details/46808793拉格朗日对偶:https://www.cnblogs.com/90zeng/p/Lagrange_duality.html对偶函数例子:https://blog.csdn.net/quiet_girl/article/detail...

2019-10-04 00:50:11 925

原创 数据挖掘,人工智能,机器学习会议总结

AI会议的总结(by南大周志华)https://blog.csdn.net/lifeitengup/article/details/8441054https://blog.csdn.net/lyb3b3b/article/details/83548964NLPhttps://www.zybuluo.com/songying/note/1167054https://blog...

2019-10-03 08:55:34 219

原创 增强拉格朗日乘子法

觉得讲的最好的博文是下面这一篇:https://blog.csdn.net/xianlingmao/article/details/7919597不等式约束的方程先最小化x再最大化参数,这种形式与目标方程是等价的但是方便于计算,所以写成这种形式对偶问题:原问题的等价问题叫做对偶问题,研究原问题觉得很复杂,通过不断地转变形式让他成为多个容易研究的子问题.https://w...

2019-10-02 16:49:17 1452

原创 张志华-统计机器学习

第一讲:频率派:最小二乘法的 y-ax 最小化等同于最大似然估计,ax为样本均值的估计量,y为样本取值,y服从高斯分布,求解含y高斯分布的均值参数的时候使用的最大化似然估计,等同于在方差固定的情况下最小化误差函数。视频最后八分钟。贝叶斯学派:首先生成数据的模型服从一种未知的分布,不同于频率派把模型中的参数当作常数,而是把模型中的参数当作一个随机变量,参数服从我们给定的某一种先...

2019-08-05 17:43:56 676

原创 R语言绘制箱线图

1.数据处理,把数据处理成箱图所需要的形式:a1<-data.frame(Average_Degree=c(13,4,2,12.15,6.667,10.67,2.286,1,1,5,11.2,11.5,11.3,11.5,11.5),Method=rep("DYNMOGA",times=15))a2<-data.frame(Average_Degree=c(11.57,8.2,...

2019-08-01 16:05:27 13274

原创 复杂网络分析拓扑指标

1.点强度:无向图研究节点i所有连接的边的权重和作为点i的点强度,在复杂网络分析中,节点的点强度越大,说明该节点转换至其他节点的频数越多,该节点越重要。平均点强度就是所有点强度和除所有点的个数所得到的值2.加权聚类系数:对于加权复杂网络,节点i的加权聚类系数定义为:式子中,k为节点i的度;a表征节点i,j,k是否构成三角形,能构成三角形时取1,否则取值为0,整个网络的加权...

2019-07-30 23:51:50 10782 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除