自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 如何写好sql

由于工作原因,需要写大量sql,将平时写sql 的方法和一些特殊功能整理一下,希望能帮助到大家。1、注意层次和注释层次快捷键:tab注释快捷键:ctrl+/2、从最里层开始写嵌套sql 从最里层开始写,即语句的中间部分,然后一步一步向外。3、语句执行顺序、每一步生成什么了然于心from>join>on>where>group by>聚合函数>having>select>distinct>order byselect distinct(

2021-01-19 14:34:47 2296 1

原创 IP、网关、端口等计算机相关名词理解

一直以来一直很困惑跟计算机网络相关的名词,看来很多的博文,每次还是会很模糊。还是自己来总结一下。网络通信过程整个网络是一个层级的概念。设备必须在同一网段内才能搜索到其他设备或者热点。一般情况下,在联网搜索过程中,需要DNS将要访问的域名解析成IP,然后通过自己所在网段的网关(路由)发送到目标网的网关,通过端口号来判定访问哪类资源并返回。子网掩码和IP的与操作可以判定电脑是否处于同一网段。...

2020-12-31 14:41:00 323

原创 Github 无法登陆,网站超时问题

网络诊断为:电脑配置没有问题,但是该网站服务器资源无法访问。简单点直接上解决办法:在hosts文件中添加网站IP。在文件目录下:C:\Windows\System32\drivers\etc 中,将hosts文件复制到桌面,右键 【属性】将【只读】勾掉(否则无法修改),随后可以选择记事本或文档等软件打开,在文件内容末添加: 140.82.113.4 github.com 199.232.69.194 github.global.ssl.fastly.net这里,需要

2020-10-22 12:15:06 766

原创 Markdown 基本语法总结

Markdown 简介Markdown 是一种轻量级标记语言,使用一些简单的语法来代替排版,常用的标记只有十多种,学习成本低,可以快速上手。在写CSDN博客时也可以直接使用Markdown语法提高书写效率,记得标记和正文之间要加空格哦。语法总结1、标题创建使用 # title ,可以创建一级标题;## title 为二级,依次类推。目前支持到六级标题创建。# 一级标题创建## 二级标题创建2、文本格式加粗 :分别将两个星号 ** 放置加粗文本前后** 加粗文本 **斜

2020-10-09 18:17:25 210

原创 数据统计检验方法

1、http://blog.sina.com.cn/s/blog_44befaf601016r5o.html2、http://blog.sina.com.cn/s/blog_4a7b9abb0102xe83.html3、https://blog.csdn.net/xiwan0902/article/details/72280352

2019-10-06 18:37:50 1536

原创 数据库B+树原理博文(通俗易懂,强烈推荐)

1、b+索引原理https://www.cnblogs.com/codehome/p/9356541.html2、聚集索引与非聚集索引https://www.cnblogs.com/s-b-b/p/8334593.html聚集索引:数据行的物理顺序与列值的顺序相同,只能有一个,默认主键。叶节点即为数据非聚集索引:数据行的物理顺序与列值的顺序相同,可以有多个,叶节点为索引,需要二次查询(耗...

2019-10-05 19:41:15 215

原创 不同网站和页面爬虫知识点

1、json.loads()解码python json格式json.load()加载python json格式文件因此使用requests.get(url)和urllib.urlopen(url)获取内容的方式如下:2、关于爬取Ajax动态加载(翻页时url不变)的网页+网站(1)中国票房网,周票房,无论选取哪一周,网址均为http://www.cbooo.cn/movieweek对于...

2019-07-25 16:39:33 695

原创 关于机器学习类别不平衡问题

1、类别不平衡会造成什么?分类器学习不平衡。由于正负样本比例不同,造成分类器为了达到较高的分类精度,会侧重于学习样本数多的一方,造成小样本分类误差提高。例如,98个正例,2个负例,则分类器会侧重学习正例的隐含关系,而负类学习程度与否对最终的精度影响都很小。kappa系数可以降低类别样本数不平衡引起的精度偏差。2、训练集和验证集为什么要保持数据分布一致?不一致会造成精度不稳定。例如上例,验证集...

2019-07-18 19:51:14 484

原创 python 异常处理

try\except\finally标准内置except error: https://www.runoob.com/python/python-exceptions.html(1)使用标准except输出error。finally语句一定会执行,引发异常后会跳出try语句继续执行下面代码。# -*- coding: utf-8 -*-import tracebackflag=True...

2019-07-12 11:53:50 169

原创 python 读写文件、遍历文件名操作

1、读取txt为list\dic\存为csv# -*- coding: utf-8 -*-import chardet #chardet.detect(content)输出编码方式import pandas as pdimport csvimport re'''读取txt、按行分割、存为列表\字典\CSV'''#转为list写csvwith open("C:\\Users\\...

2019-07-08 17:00:37 673

原创 office日常使用小技能

1、列表变成黑块,原因是字体库样式损坏,需要重置。在word 审阅视图下,宏、查看宏、命名后创建宏,复制以下代码:For Each templ In ActiveDocument.ListTemplatesFor Each lev In templ.ListLevelslev.Font.ResetNext levNext templ点击运行(向右的三角形)2、列表后和文字间距过大...

2019-06-17 13:56:40 276

原创 python 使用小知识点

1、每次生成随机数时,都指定一样的seed,则生成的随机数一致。random.seed(1)random.randn(5,3)2、使用assert 来检查程序是否正确,正确执行,不正确报错,在判断矩阵操作的维数时很方便。assert (Z.shape == (W.shape[0],A.shape[1]),其中,shape[0]为矩阵行数,shape[1]为矩阵列数。3、python中...

2019-06-15 11:44:20 382

原创 PCA原理及人脸识别matlab实现

一、PCA:降维,和因子分析的区别二、基于PCA的人脸识别(matlab实现)还是得先训练:基于庞大的样本库,例如现实中人脸拍照(银行、车站),都是数据采集,可以用来建立人脸库。使用PCA得到每个人的脸特征脸,对于新人脸,判断特征投影与哪个样本最近。三、网站的图片识别是如何做的?...

2019-05-24 21:50:15 5248 2

原创 随机森林简介

随机森林是多个cart树弱分类器组合成的集成学习方法。1、cart 树如何选择特征、剪枝2、matlab随机森林包 百度云链接:

2019-05-24 21:37:22 519

转载 集成学习方法简介:bagging、boosting、stacking

一、集成学习集成学习是将若干个学习器(分类器、回归器)组合之后产生一个新的学习器。一般来说,集成学习可以分为三类:bagging:减少方差,即防止过拟合boosting:减少偏差,即提高训练样本正确率stacking:提升预测结果,即提高验证精度弱分类器(weak learner)是指那些分类准确率值只稍好于随机猜测的分类器(error<0.5);集成算法的成功在于保证弱分类器...

2019-05-24 20:32:55 1583

原创 EM算法通俗理解及数学推导

1、EM,exception maximum.用于非监督分类的学习方法。EM算法的思想:非监督学习中,只有数据、不知道数据属于什么参数(均值、方差)的高斯分布、不知道数据的类别标签,EM将各“类别”的高斯分布参数作为未知,最大化获得该组样本的概率。假设每个样本独立分布,获取该样本的概率为q则获取该组样本的概率为:通过最大似然,得到目标函数为。公式推导如下:方法本身原理为坐标上升法,即(...

2019-05-15 20:09:36 668

原创 logistic分类

1、原理:使用sigmod函数将回归映射到分类。二分类2、代价函数:使用概率分布、伯努利方程设计最大 似然性为代价函数目标函数:最小化 -似然最大3、参数求解:梯度下降(上升?)数学推导:sig’=h*(1-h)4、模型训练代码:(1)批梯度下降和随机梯度下降(2)关于代价函数和收敛训练好模型后就可以将权重设置为定制,输入数据特征,通过判断sig输出与0.5的阈值就可以判断类别了。...

2019-05-14 21:33:14 1194

原创 训练和验证知识小结

1、训练误差和一般误差的误差界2、偏差-方差均衡偏差:预测结果的不正确性程度方差:拟合出来的奇怪的关系。3、模型的选择:选择最小的一般误差对于(1)多项式次数选择、(2)SVM惩罚力度、(3)局部加权回归带宽参数交叉验证方法:(1)训练集70%,测试集30%(2)k-fold 交叉验证。选择平均一般误差最小的(3)留1验证4、特征选择:(1)前向搜索,每次加入一个特征交叉验证...

2019-05-12 20:34:27 581

原创 关于线性模型的学习和总结

1、线性回归2、最小二乘求解及原理解释(梯度下降、随机梯度下降;矩阵求解、误差的高斯分布)3、局部加权回归、过拟合、欠拟合4、线性分类(二分类):对数(logistic)回归。sigmod函数,概率密度分布函数,伯努利方程。最大似然法。求解使用似然函数的梯度下降和原函数的牛顿法,按照切线下降。来回io,直到差值很小则回归。5、广义线性模型:概率密度分布函数满足指数族分布的;对于多类分类6...

2019-05-08 19:56:10 607

原创 关于SVM线性超平面的理解

优化问题:最小化代价函数 w21、拉格朗日算子2、对偶问题3、KKT条件(非等式约束)4、凸函数5、假设一切极值点在边界取得6、支持向量(高维)7、核函数...

2019-05-08 19:37:40 862

原创 python爬取微信好友信息并生成词云

文章参考链接:http://www.cnblogs.com/jiaoyu121/p/6944398.htmlitchat Api说明文档:https://itchat.readthedocs.io/zh/latest/api/主要用的是itchat 和 wordcloud 包。itchat.get_friends函数返回一个列表:附完整代码:# -*- coding:utf-8 -*-...

2019-04-27 22:06:57 335

原创 python爬虫入门

爬虫的基本步骤:获取url、解析网页并寻找所需内容;数据处理;保存。知识点:(1)通常同一类型网页的url具有一定规律,爬取时需要注意观察,例如景点第2页:https://travel.qunar.com/p-cs299878-shanghai-jingdian-1-2第3页:https://travel.qunar.com/p-cs299878-shanghai-jingdian-1-3...

2019-04-22 12:28:19 232

原创 pip 使用方法(导入arcpy出现 DLL load failed: %1 不是有效的 Win32 应用程序)

通常由于dll包解析错误或者版本不兼容,此时需要注意查看错误时哪个包引起的,使用pip或者anaconda2重新下载即可,也可以直接从其它人拷贝正确的包,放入对应包文件中。外部下载包位于site packages文件下。Pip下载:Win+R 进入cmd窗口,使用cd 命令进入pip.exe 所在文件夹,执行pip install(uninstall)即可。cd… :返回上一级目录d: ...

2019-04-22 10:44:45 1715

原创 关于python基础错误UnicodeDecodeError、TypeError

UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe6当路径或数据名称中有中文存在时,需要指定为 Unicode 编码,ASCII码不能识别。在程序头添加语句# -- coding: utf-8 --,并在中文前加字符 u 即可.例如:(1) env.workspace= u"D:/python练习/new.gdb.教育设施"...

2019-04-21 22:59:28 652

原创 AE ICommand工具以及右键菜单ToolStripMenuItem用法

1、Icommand接口 位于systemUI命名空间下,封装常用的操作工具。例如(1)地图交互操作:放大、缩小、选择、查询等(2)直接操作工具,即不用与地图进行交互的工具:另存、全图、添加数据等。对于第一种工具使用方法: private IMapControlDefault mapCtl; //需声明全局变量 private void 缩小_Click(objec...

2019-04-21 22:29:15 2708

原创 c#鹰眼地图的实现(理解消息传递机制)

思路:axMapControl1加载主图时,触发其OnMapReplaced事件,将加载的图层同样加载到鹰眼控件即axMapControl2中,当主图的extent变化例如放大缩小事件,会触发主图的OnExtentUpdated事件,此时设置矩形边框的颜色等参数。另外需要在点击鹰眼图层时(OnMouseDown事件)使得主图范围随之变化。#region 鹰眼实现代码 private vo...

2019-04-21 22:12:07 596

原创 AE 调用GP工具方法介绍及常见错误“对 COM 组件的调用返回了错误 HRESULTE_FAIL

调用GP工具的方式有两种:一种是使用Geoprocessing类,工具参数使用IVariantArray方式输入;另一种是使用Geoprocessor托管类,创建工具对象,参数作为该工具对象的属性输入。使用Geoprocessing类:主要分为以下几步:1,添加ESRI.ArcGIS.Geoprocessing引用,仅需要引用该类库2,创建geoProcessor对象,注意这里的P是大...

2019-04-21 22:06:59 1326

原创 AE修改栅格像元值并另存

在运行过程中不要使用arcgis打开栅格,否则会因为程序锁而无法修改。其原理是 根据图像创建合适的移动窗口,移动遍历读取并修改栅格像元值,数组array保存一个波段的全部像元值,最后写回。 另存为栅格,使用 复制原始栅格并修改像元值 达到目的。需要添加引用:using ESRI.ArcGIS.Geoprocessor;using ESRI.ArcGIS.DataManagementTo...

2019-04-21 22:02:40 683 1

原创 Oracle数据写入自增+触发器

Oracle不能像MySQL那样设置主键自增,在写入数据的时候需要用<序列+触发器>的方式使数据表的一列或多列实现自增。两者可在视图中创建,也可以使用sql语句创建。1、创建序列 dual 的sql语句:create sequence dualminvalue 1maxvalue 99start with 1increment by 1nocache;在oracle中...

2019-04-21 21:42:50 460

原创 c#数据库知识点总结

数据提供者Data Provider用来提供DataSet(以同样的方式从不同数据源获得数据,数据源的内存驻留形式)和数据库之间的联系,也包含了存取数据库的一系列接口。包括Sql Server .NET,OleDb.NET,Odbc.NET和Oracle.NET。每种有4个核心对象,对象间互相配合完成数据库的连接、操作、交互。(1)Connection对象:对于不同的.net数据提供者,ADO....

2019-04-21 21:39:09 729

原创 AE地图数据打开方式小结

1、打开shp 格式文件并返回图层,本地和GDB:public IFeatureLayer AddShp(string filePath)        {            IWorkspaceFactory ...

2019-04-21 21:33:06 295

原创 matlab简单人脸识别

matlab简单识别人脸(只适用于人脸信息占主导的图片)思考:针对该种图片方法的改进,可以考虑检测眼睛,以眼的特征及眼距作为判断,并生成中心点进行扩充i=imread(‘face1.jpeg’);I=rgb2gray(i); %RGB到灰度图像BW=im2bw(I); %灰度图像转换为二值图像L=bwlabel(BW,8); %8个像素大小的连通域BB=regionprops(L,...

2019-04-21 21:30:43 2838 4

原创 RGB到灰度图像的转换原理

RGB图像有3个通道,也就是一个3维的矩阵,灰度图只有一个通道转换公式简单来说,就是把RGB3个通道的分量按照一定的比例计算到灰度图像中。Gray = R0.299 + G0.587 + B0.114matlab实现转换(直接显示使用rgb2gray函数)img=imread(‘face1.jpeg’);[m,n,h] = size(img);gray =zeros(m,n);for...

2019-04-21 21:26:59 3764

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除