自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 收藏
  • 关注

原创 第5章 合并

第5章 合并import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv')df.head()# import numpy as np# import pandas as pd # df=pd.read_csv('data/table.csv')# df.head() ...

2020-04-30 23:45:19 754

原创 Task4 条件随机场

条件随机场马尔可夫过程定义假设一个随机过程中,tnt_ntn​ 时刻的状态xnx_nxn​的条件发布,只与其前一状态xn−1x_{n-1}xn−1​ 相关,即:P(xn∣x1,x2,...,xn−1)=P(xn∣xn−1) P(x_n|x_1,x_2,...,x_{n-1}) = P(x_n|x_{n-1})P(xn​∣x1​,x2​,...,xn−1​)=P(xn​∣xn−1​...

2020-04-29 23:52:52 131

原创 Task05 图像分割/二值化

# Datawhale 计算机视觉基础-图像处理(上)-Task05 图像分割/二值化5.1 简介该部分的学习内容是对经典的阈值分割算法进行回顾,图像阈值化分割是一种传统的最常用的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术。它特别适用于目标和背景占据不同灰度级范围的图像。它不仅可以极大的压缩数据量,而且也大大简化了分析和处理步骤,因此在很多情况...

2020-04-29 23:03:39 354

原创 第4章 变形

第4章 变形import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv')df.head()# import numpy as np# import pandas as pd # df=pd.read_csv('data/table.csv')# df.head() ...

2020-04-28 23:28:19 644

原创 Task04 图像滤波

# Datawhale 计算机视觉基础-图像处理(上)-Task04 图像滤波4.1 简介图像的实质是一种二维信号,滤波是信号处理中的一个重要概念。在图像处理中,滤波是一种非常常见的技术,它们的原理非常简单,但是其思想却十分值得借鉴,滤波是很多图像算法的前置步骤或基础,掌握图像滤波对理解卷积神经网络也有一定帮助。4.2 学习目标了解图像滤波的分类和基本概念理解均值滤波/方框滤波、...

2020-04-27 21:29:54 225 1

原创 第3章 分组

第3章 分组import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv',index_col='ID')df.head() School Class Gender Address Height Weig...

2020-04-27 21:23:58 513

原创 第3章 分组

第3章 分组import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv',index_col='ID')df.head() School Class Gender Address Height Weig...

2020-04-26 23:34:33 752

原创 ip代理

为什么会出现IP被封网站为了防止被爬取,会有反爬机制,对于同一个IP地址的大量同类型的访问,会封锁IP,过一段时间后,才能继续访问如何应对IP被封的问题有几种套路:修改请求头,模拟浏览器(而不是代码去直接访问)去访问采用代理IP并轮换设置访问时间间隔如何获取代理IP地址从该网站获取: https://www.xicidaili.com/inspect -> 鼠标定位:...

2020-04-25 23:44:21 30012

原创 Task03 彩色空间互转

Datawhale 计算机视觉基础-图像处理(上)-Task03 彩色空间互转3.1 简介图像彩色空间互转在图像处理中应用非常广泛,而且很多算法只对灰度图有效;另外,相比RGB,其他颜色空间(比如HSV、HSI)更具可分离性和可操作性,所以很多图像算法需要将图像从RGB转为其他颜色空间,所以图像彩色互转是十分重要和关键的。3.2 学习目标了解相关颜色空间的基础知识理解彩色空间互转的理论...

2020-04-25 22:45:20 171

原创 Task3 EM

前言EM算法是机器学习十大算法之一,它很简单,但是也同样很有深度,简单是因为它就分两步求解问题,E步:求期望(expectation)M步:求极大(maximization)深度在于它的数学推理涉及到比较繁杂的概率公式等,所以本文会介绍很多概率方面的知识,不懂的同学可以先去了解一些知识,当然本文也会尽可能的讲解清楚这些知识,讲的不好的地方麻烦大家评论指出,后续不断改进完善。EM算法引...

2020-04-25 21:59:12 539

原创 Task 02 re(2.3)

2.3 学习正则表达式 re2.3.1 为什么使用正则表达式?典型的搜索和替换操作要求您提供与预期的搜索结果匹配的确切文本。虽然这种技术对于对静态文本执行简单搜索和替换任务可能已经足够了,但它缺乏灵活性,若采用这种方法搜索动态文本,即使不是不可能,至少也会变得很困难。通过使用正则表达式,可以:- 测试字符串内的模式。 例如,可以测试输入字符串,以查看字符串内是否出现电话号码模式或信...

2020-04-25 00:30:22 1146

原创 Task 02 Xpath(2.2)

2.2 学习xpath2.2.1 学习目标:学习xpath,使用lxml+xpath提取内容。使用xpath提取丁香园论坛的回复内容。抓取丁香园网页:http://www.dxy.cn/bbs/thread/626626#626626 。2.2.2 Xpath常用的路径表达式:XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文...

2020-04-24 13:15:37 229

原创 Task 02 bs4 Beautiful Soup库入门(2.1)

二、学习内容2.1 Beautiful Soup库入门学习beautifulsoup基础知识。使用beautifulsoup解析HTML页面。Beautiful Soup 是一个HTML/XML 的解析器,主要用于解析和提取 HTML/XML 数据。它基于HTML DOM 的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml。B...

2020-04-24 10:26:32 122

原创 Task 02 bs4 Beautiful Soup库入门(2.1)

二、学习内容2.1 Beautiful Soup库入门学习beautifulsoup基础知识。使用beautifulsoup解析HTML页面。Beautiful Soup 是一个HTML/XML 的解析器,主要用于解析和提取 HTML/XML 数据。它基于HTML DOM 的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml。Beauti...

2020-04-23 23:30:18 165

原创 Task02 几何变换

Datawhale 计算机视觉基础-图像处理(上)-Task02 几何变换2.1 简介该部分将对基本的几何变换进行学习,几何变换的原理大多都是相似,只是变换矩阵不同,因此,我们以最常用的平移和旋转为例进行学习。在深度学习领域,我们常用平移、旋转、镜像等操作进行数据增广;在传统CV领域,由于某些拍摄角度的问题,我们需要对图像进行矫正处理,而几何变换正是这个处理过程的基础,因此了解和学习几何变换也...

2020-04-23 22:03:53 213

原创 Task2 bayes_plus

知识点梳理相关概念(生成模型、判别模型)先验概率、条件概率贝叶斯决策理论贝叶斯定理公式极值问题情况下的每个类的分类概率下溢问题如何解决零概率问题如何解决?优缺点sklearn参数详解,Python绘制决策树sklearn接口from sklearn.naive_bayes import GaussianNBfrom sklearn.datasets import loa...

2020-04-23 21:16:41 301

原创 第2章 索引

第2章 索引import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv',index_col='ID')df.head() School Class Gender Address Height Weig...

2020-04-23 16:31:39 1200

原创 task1图像插值算法

Datawhale 计算机视觉基础-图像处理(上)-Task01 OpenCV框架与图像插值算法1.1 简介  在图像处理中,平移变换、旋转变换以及放缩变换是一些基础且常用的操作。这些几何变换并不改变图象的象素值,只是在图象平面上进行象素的重新排列。在一幅输入图象[u,v][u,v][u,v]中,灰度值仅在整数位置上有定义。然而,输出图象[x,y]的灰度值一般由处在非整数坐标上的(u,v)(u...

2020-04-21 22:51:46 201

原创 爬虫~爬爬爬~task1

互联网、HTTP互联网互联网也叫因特网(Internet),是指网络与网络所串联成的庞大网络,这些网络以一组标准的网络协议族相连,连接全世界几十亿个设备,形成逻辑上的单一巨大国际网络。它由从地方到全球范围内几百万个私人的、学术界的、企业的和政府的网络所构成。通过电子、无线和光纤等一系列广泛的技术来实现。这种将计算机网络互相连接在一起的方法可称作“网络互联”,在此基础上发展出来的覆盖全世界的全球...

2020-04-21 19:08:20 3297

原创 第1章 Pandas基础

第1章 Pandas基础import pandas as pdimport numpy as npimport pandas as pdimport numpy as np查看Pandas版本pd.__version__'1.0.3'pd.__version__'1.0.3'一、文件读取与写入1. 读取(a)csv格式df = pd.read_csv('da...

2020-04-20 20:05:03 1719

原创 Task1 Linear_regression

线性回归的概念1、线性回归的原理2、线性回归损失函数、代价函数、目标函数3、优化方法(梯度下降法、牛顿法、拟牛顿法等)4、线性回归的评估指标5、sklearn参数详解1、线性回归的原理进入一家房产网,可以看到房价、面积、厅室呈现以下数据: 面积($x_1$) 厅室数量($x_2)$ 价格(万元)(y) ...

2020-04-20 01:30:16 217

原创 概率论~数学期望&方差

数学期望方差

2020-04-19 19:30:24 644

原创 蓝桥杯校内模拟赛

问题描述  将LANQIAO中的字母重新排列,可以得到不同的单词,如LANQIAO、AAILNOQ等,注意这7个字母都要被用上,单词不一定有具体的英文意义。  请问,总共能排列如多少个不同的单词。答案提交  这是一道结果填空的题,你只需要算出结果后提交即可。本题的结果为一个整数,在提交答案时只填写这个整数,填写多余的内容将无法得分。res=1for i in range(1,8): ...

2020-04-18 16:09:08 213

原创 均匀分布&二项分布&泊松分布&正态分布&&Z=X+Y的概率密度&&Z=X/Y&&Z=XY&&max{X,Y}的分布&&min{X,Y}的分布

泊松分布均匀分布正态分布Z=X+YZ=X/Y&&Z=XYmax{X,Y}的分布&&min{X,Y}的分布

2020-04-17 21:54:28 3380

原创 蓝桥杯~算法训练 Sereja and Squares(python)

试题 算法训练 Sereja and Squares提交此题资源限制时间限制:4.0s 内存限制:256.0MB问题描述  Sereja在平面上画了n个点,点i在坐标(i,0)。然后,Sereja给每个点标上了一个小写或大写英文字母。Sereja不喜欢字母"x",所以他不用它标记点。Sereja认为这些点是漂亮的,当且仅当:  ·所有的点可以被分成若干对,使得每个点恰好属于一一对之...

2020-04-15 00:41:11 2352 6

原创 蓝桥杯~算法训练 Yaroslav and Algorithm

试题 算法训练 Yaroslav and Algorithm提交此题资源限制时间限制:100ms 内存限制:128.0MB问题描述  (这道题的数据和SPJ已完工,尽情来虐吧!)Yaroslav喜欢算法。我们将描述一个他最喜欢的算法。1.这个算法接受一个字符串作为输入。我们设这个输入字符串为a。  2.这个算法由一些命令组成。i号命令的形式为"s[i]>>w[i]“...

2020-04-14 00:36:46 2457 9

原创 蓝桥杯~算法训练 猴子吃包子

试题 算法训练 猴子吃包子提交此题资源限制时间限制:1.0s 内存限制:256.0MB问题描述  从前,有一只吃包子很厉害的猴子,它可以吃无数个包子,但是,它吃不同的包子速度也不同;肉包每秒钟吃x个;韭菜包每秒钟吃y个;没有馅的包子每秒钟吃z个;现在有x1个肉包,y1个韭菜包,z1个没有馅的包子;问:猴子吃完这些包子要多久?结果保留p位小数。输入格式  输入1行,包含7个整数,分...

2020-04-13 00:27:07 379

原创 137. 只出现一次的数字||(位运算)

137. 只出现一次的数字 II难度中等292给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现了三次。找出那个只出现了一次的元素。说明:你的算法应该具有线性时间复杂度。 你可以不使用额外空间来实现吗?示例 1:输入: [2,2,3,2]输出: 3示例 2:输入: [0,1,0,1,0,1,99]输出: 99字典class Solution: ...

2020-04-12 01:34:03 141

原创 蓝桥杯入门训练&基础练习

圆的面积import mathPI=3.14159265358979323r=float(input())from decimal import *a=PI*r*rprint ('%.7f'%a)578.5398163a=int(input())temp1=1temp2=1res=0t=0for i in range(3,a+1): res=(temp1+...

2020-04-11 14:37:07 9818

原创 蓝桥杯基础练习~分解质因数&字符串对比&时间转换

试题 基础练习 分解质因数提交此题资源限制时间限制:1.0s 内存限制:512.0MB问题描述  求出区间[a,b]中所有整数的质因数分解。输入格式  输入两个整数a,b。输出格式  每行输出一个数的分解,形如k=a1a2a3…(a1<=a2<=a3…,k也是从小到大的)(具体可看样例)样例输入3 10样例输出3=34=225=56=237=78...

2020-04-11 14:33:43 238

原创 蓝桥杯基础练习~ 矩形面积交&矩阵乘法

试题 基础练习 矩形面积交提交此题资源限制时间限制:1.0s 内存限制:512.0MB问题描述  平面上有两个矩形,它们的边平行于直角坐标系的X轴或Y轴。对于每个矩形,我们给出它的一对相对顶点的坐标,请你编程算出两个矩形的交的面积。输入格式  输入仅包含两行,每行描述一个矩形。  在每行中,给出矩形的一对相对顶点的坐标,每个点的坐标都用两个绝对值不超过10^7的实数表示。输出...

2020-04-10 23:50:02 191

原创 线性规划单纯形算法&对偶单纯性算法matlab

单纯性算法%输入参量'function [ X,z ] = lp( N,b,Cn )%N:约束条件系数矩阵,b:资源向量,Cn:价值向量%N=[1 0;0 2;3 2];%初始基变量,就是没有使用的,没有添加松弛变量的[row,col] = size(N);E=eye(row);%使用单位矩阵A=[N E];%合起来的A%Cn=[2 3];%目标函数的参数Cb=zeros(...

2020-04-09 23:12:17 2806

原创 python 字典获取最大和最小的value&sorted函数使用

python 字典获取最大和最小的valuemy_dict = {'x':500, 'y':5874, 'z': 560} key_max = max(my_dict.keys(), key=(lambda k: my_dict[k])) key_min = min(my_dict.keys(), key=(lambda k: my_dict[k])) print('Ma...

2020-04-09 23:05:24 1036

原创 蓝桥杯基础练习~芯片测试&FJ的字符串&Sine之舞&数的读法&完美的代价

试题 基础练习 芯片测试提交此题资源限制时间限制:1.0s 内存限制:512.0MB问题描述  有n(2≤n≤20)块芯片,有好有坏,已知好芯片比坏芯片多。  每个芯片都能用来测试其他芯片。用好芯片测试其他芯片时,能正确给出被测试芯片是好还是坏。而用坏芯片测试其他芯片时,会随机给出好或是坏的测试结果(即此结果与被测试芯片实际的好坏无关)。  给出所有芯片的测试结果,问哪些芯片是好...

2020-04-09 23:04:13 268

原创 蓝桥杯基础练习~报时助手&回形取数&龟兔赛跑预测

试题 基础练习 报时助手提交此题资源限制时间限制:1.0s 内存限制:512.0MB问题描述  给定当前的时间,请用英文的读法将它读出来。  时间用时h和分m表示,在英文的读法中,读一个时间的方法是:  如果m为0,则将时读出来,然后加上“o’clock”,如3:00读作“three o’clock”。  如果m不为0,则将时读出来,然后将分读出来,如5:30读作“five t...

2020-04-08 23:32:44 216

原创 蓝桥杯基础练习~阶乘计算&高精度加法&Huffuman树&2n皇后问题

试题 基础练习 阶乘计算提交此题资源限制时间限制:1.0s 内存限制:512.0MB问题描述  输入一个正整数n,输出n!的值。  其中n!=123*…*n。算法描述  n!可能很大,而计算机能表示的整数范围有限,需要使用高精度计算的方法。使用一个数组A来表示一个大整数a,A[0]表示a的个位,A[1]表示a的十位,依次类推。  将a乘以一个整数k变为将数组A的每一个元素都乘...

2020-04-07 21:57:07 459 1

原创 蓝桥杯基础训练~01字串&闰年判断

01字串问题描述对于长度为5位的一个01串,每一位都可能是0或1,一共有32种可能。它们的前几个是:0000000001000100001100100请按从小到大的顺序输出这32种01串。输入格式本试题没有输入。输出格式输出32行,按从小到大的顺序每行一个长度为5的01串。样例输出00000000010001000011<以下部分省略>for i ...

2020-04-06 23:02:31 200 1

原创 蓝桥杯刷题~入门训练及基础练习前11题

圆的面积import mathPI=3.14159265358979323r=float(input())from decimal import *a=PI*r*rprint ('%.7f'%a)578.5398163a=int(input())temp1=1temp2=1res=0t=0for i in range(3,a+1): res=(temp1+...

2020-04-05 20:33:15 394

原创 Datawhale 零基础入门数据挖掘-Task5 模型融合

Datawhale 零基础入门数据挖掘-Task5 模型融合五、模型融合Tip:此部分为零基础入门数据挖掘的 Task5 模型融合 部分,带你来了解各种模型结果的融合方式,在比赛的攻坚时刻冲刺Top,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/int...

2020-04-04 20:57:29 292

原创 matlab实现的一个简易的svm用于演示四个点的两类分类问题

%%简单的SVM程序,用于演示四个点的两类分类情况%此例子为线性可分情况%课上PPT例程%clc; %关闭所有的变量和窗口clear all;close all;%定义各个点t=[0 0;0 1;1 0;1 1]; %输入y=[1 1 -1 -1]; %点的分类[m,n]=size(t); x=zeros(m,1);%解释quadprog(H,f...

2020-04-02 21:14:15 551

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除