自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(3626)
  • 资源 (4)
  • 收藏
  • 关注

原创 高级数据结构及应用 —— 使用 bitmap 进行字符串去重

bitmap 即为由单个元素为 boolean(0/1, 0 表示未出现,1 表示已经出现过)的数组。如果C/C++ 没有原生的 boolean 类型,可以用 int 或 char 来作为 bitmap 使用,如果我们要判断某字符(char)是否出现过,使用 int 作为 bitmap 的底层数据结构,bitmap 即为 int 数组,一个 int 长度为 32 个 bit 位, c ...

2018-06-03 10:34:05 2421

原创 二进制比特位运算

1. 基本运算截断保留后 k 位,比如 83 == 0x0101 0011 保留后 5 位,即为 0x0001 0011 == 19 x & (pow(2, k)-1)x & 0x1fa 的第 k 位清零:a &= ~(1 << k)a 的第 k 位置 1:a |= (1 << k)...

2018-06-01 22:11:11 2874

原创 C 语言经典面试题 —— 宏

1. 运算符优先级与括号#define Cube(a) a*a*a无法解决 Cube(1+1) ⇒ 1+1*1+1*1+1 ⇒ 4,期待的应当是 8,故将其改造为 #define Cube(a) (a)*(a)*(a)如此,自身运算的优先级是能解决了,和其他表达式结合时便又存在先运算和后运算的算符优先级的问题,比如其前跟着一个除法运算符:16/Cube(2) ⇒ 16 /...

2018-06-01 21:42:00 1515

原创 maven 细节 —— scope、坐标

对于 idea 开发环境,测试代码便是在 src/test/java(该java目录会在创建时标注为测试文件夹) 目录下的 .java 代码为测试代码: 1. scopescope的分类compile:默认值 他表示被依赖项目需要参与当前项目的编译,还有后续的测试,运行周期也参与其中,是一个比较强的依赖。打包的时候通常需要包含进去test:依赖项目仅仅参与测试相关的工作,...

2018-05-31 23:25:01 1459

原创 Python 笔试 —— 效率与优雅

1. 效率字符串拼接:加号拼接字符串将造成对象的创建和垃圾的回收;使用字符串的 join 方法对尤其是循环中的字符串进行拼接(先将不断出现的字符串 append 到 一个 list 中,再进行 join);>> ''.join('hello').join('world')'whelloohellorhellolhellod' # 会对 'hello' ...

2018-05-30 21:59:05 1225

原创 Java 经典面试题 —— 性能与安全

1. 性能String、StringBuffer 与 StringBuilder两个字符串相加,str1+str2,相当于执行:StringBuilder strBuilder1 = new StringBuilder(str1);strBuilder1.append(str2);String result = strBuilder1.toString();执行到最后,我们所...

2018-05-30 21:35:08 1252

原创 Python 爬虫工具 —— fake_useragent

服务器为避免爬虫工具无休止的请求,以减轻负载,会对 user agent 进行校验,即判断某一 user-agent 是否不断地进行请求。可采用如下方式进行绕过服务器的校验。UserAgent_List = [ "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Saf...

2018-05-28 23:44:04 1840

原创 正则表达式 —— Cases 与 Tricks

1. cases匹配任意单词(两侧可以有多个空格): ( +[a-zA-Z]+ +)上述表达式无法匹配句子末尾的单词,若想匹配句尾或者逗号前的单词,则可拓展为: ( +[a-zA-Z]+[?,.]? +) 中括号内的?表示问号这一标点,中括号后的?则表示匹配之前的项 1 次或 0 次;匹配空行: windows:^(\s*)\r\nLinux:^(\s*)\n匹配 ip:[0...

2018-05-24 22:45:29 788

原创 math、numpy、pandas NaN 判断

>> np.nan == np.nanFalse>> np.nan is np.nanTrue>> math.nan is np.nanFalse>> np.isnan(math.nan)True1. 判断 ndarray 中是否存在 nan>> c = np.array([ 1., 2., np.nan, ...

2018-05-21 23:25:14 13114

原创 Gauss error function

0. error functionerf(x)=1π−−√∫x−xe−t2dterf(x)=1π∫−xxe−t2dt\text{erf}(x)=\frac{1}{\sqrt\pi}\int_{-x}^{x}e^{-t^2}dtpython 下的 math 标准库定义着 erf 的实现。1. 从 error function 到标准正态分布 cdf 的实现标准正态分布的累积分布函...

2018-05-20 17:47:36 2725

原创 异常值检测 —— MAD(median absolute deviation)

MAD 定义为,一元序列 XiXiX_i 同其中位数偏差的绝对值的中位数(deviation,偏差本身有正有负);MAD=median(|Xi−median(X)|)MAD=median(|Xi−median(X)|)\text{MAD=median}\left(|X_i-\text{median(X)}|\right)1. MAD 用于异常点的检测假定数据服从正态分布,我们让...

2018-05-20 13:00:25 18564 2

原创 标准正态分布表(scipy.stats)

0. 标准正态分布表与常用值 Z-score 是非标准正态分布标准化后的 x即 z=x−μσz=x−μσz = \frac{x-\mu}{\sigma}表头的横向表示小数点后第二位,表头的纵向则为整数部分以及小数点后第一位;两者联合作为完整的 x,坐标轴的横轴表中的值为图中红色区域的面积,也即 cdf,连续分布的累积概率函数,记为 Φ(x)Φ(x)\Phi(x)cdf 的逆,...

2018-05-20 12:31:52 424927 3

原创 linux 实用命令 —— cut、tr、sort、touch

1. [:alnum:]tr -cd ‘[:alnum:]’-d:delete;-c:complement;-cd:删除后边的参数以外的;[:class:][:alpah:]:字母,[:digit:]:数字; [:xdigit:]:十六进制字符[:alnum:]:字母和数字[:cntrl:]:控制(非打印)字符;[:punct:]:标点; [:print:]:可打印字符[...

2018-05-17 22:33:07 1426

原创 makefile 使用 Tricks

.phony是表示目标是伪目标,并不生成相应的文件。.phony标志的文件总是执行的。1. 短横(-)与@@(常用在 echo 之前):make 在执行编译打包等命令前会在命令行输出此命令,称之为回显,如果要执行的命令前以字符@开始,则不会回显该条命令,echo XXX...# 执行该条命令时,将输出:echo XXX...XXX... # 不仅会输出echo...

2018-05-16 22:49:05 962

原创 gcc/g++ 使用 tricks

0. 优化级别-O0,不进行优化的编译后的文件大小反而更小,小于 -O2 的;1. -std 指定 C 语言标准-ansi -ansi == -std=c90-std=c99:(std:standard) 循环变量在 for 语句中定义,也即for (int i = 0; i < 10; ++i),c99 语法才支持,在ansi也即c90的语法中是不支持的,循环变量必...

2018-05-14 23:08:24 727

原创 vim 使用 Tricks

vim + /etc/fstab:打开文档时直接光标直接置于最后一行首部;1. 最小影响的修改:非 insert mode 修改del/x:删除光标所在字符;r:replace,替换光标所在的字符;xp:交换光标处字符及光标后的下一个字符的相对顺序;cw:修改光标所对应的整个单词; c:change,w:word...

2018-05-13 19:16:40 723

原创 树莓派与node.js —— onoff、dht

1. 点亮二极管(开关控)tm-onoffvar Gpio = require('tm-onoff').Gpio, led = new Gpio(17, 'out'), button = new Gpio(18, 'in', 'both'); // 'both':按钮的上升下降沿都应该被处理,即调用如下的函数button.watch(function(e...

2018-05-12 18:16:40 1579 1

原创 npm 包管理器的使用

1. 权限问题Warning “root” does not have permission to access the dev dir · Issue #454 · nodejs/node-gyp · GitHubWarning “root” does not have permission to access the dev dir ,使用 sudo 仍然抛出这样的权限异常,可在 n...

2018-05-12 11:22:04 723

原创 advanced ip scanner —— 局域网下 ip 及设备的扫描

advanced ip scanner 下载地址:Advanced IP Scanner - Download Free Network Scanner.用于扫描当前局域网下全部设备及其 ip,构建智能家居物联网时非常实用的一个发现新增设备的工具。...

2018-05-09 22:19:11 5541

原创 CPU 架构 —— ARM 架构

linux 系统查看 CPU 架构命令:$ archarmv7l$ uname -marmv7l # -m:--machine一般嵌入式设备运行在 ARM 处理器上; 树莓派一般的 PC:x86、x64 架构;

2018-05-09 21:16:59 3267

原创 树莓派系统常用配置文件及常用软件

1. wifi$ sudo vim /etc/wpa_supplicant/wpa_supplicant.confnetwork { ssid="" psk="" key_mgmt= priority=}ssid:wifi 名称;psk:wifi 密码;key_mgmt 比如设置为: WPA_PSK当同时存在多个可用 wifi 时,可通过 ...

2018-05-08 23:23:47 1650 1

原创 动态更新 HTML 内容 —— AJAX

通过 JavaScript 加载数据,在不刷新网页的情况下,更新网页内容的技术,称为 AJAX(Asynchronous JavaScript and XML,异步 JavaScript 和 XML)。1. 改变页面元素如下所示网页,想要通过 JavaScript 的方式更改温度数字。<body> <p> 当前温度:<span id="...

2018-05-08 22:20:45 9239

原创 版本号的管理

1. 语义化版本模式Semantic Versioning 语义化版本的介绍:Semantic Versioning 2.0.0语义化版本 2.0.0主版本.小版本.补丁:MAJOR.MINOR.PATCH(主版本号.次版本号.修订号)主版本号:当你做了不兼容的 API 修改,次版本号:当你做了向下兼容的功能性新增,修订号:当你做了向下兼容的问题修正。...

2018-05-07 20:56:55 2067 1

原创 Linux shell —— 数组与关联数组

使用 declare -A(declare 的用法请使用 help 进行查看,help declare) 进行声明关联数组变量;$ declare -A fruits_price$ fruits_price=([apple]='$100' [orange]='$150')列出关联数组的索引(也就是 key):$ echo ${!fruits_price[*]}$ echo ${!f...

2018-05-06 19:42:01 962

原创 前端开发 —— BOM

0. BOM vs. DOMBOM:Browser Object Model,浏览器对象模型,是在 web 中使用 JavaScript 的绝对核心; BOM:提供了独立于内容而与浏览器窗口进行交互的对象。BOM 提供了很多对象(window、location、navigator),用于访问浏览器的功能,这些功能与任何网页内容无关;DOM:Document Object Model,D...

2018-05-06 17:49:46 1222

原创 vscode 常用插件

0. 常用插件vscode-icons:在不同的文件类型文件类型名显示文件类型对应的图标;youcompleteme:terminal1. HTML Snippets:自动填充文件头部信息Visual Studio Code修改HTML Snippets插件中默认模板内容使用方法:安装 html snippets 插件之后,在待编辑的 html 页面内部,输入html:5...

2018-05-06 11:28:27 1291

原创 前端开发 —— js 常用工具函数(utilities)

1. 时间function getCurTime() { var date = new Date(); return date.toLocaleTimeString();}date.toLocaleTimeString():上午还是下午,几点几分;date.toLocaleDateString():日期,月和日;2. 随机区间:function...

2018-05-06 11:03:36 2012

原创 前端开发 —— google chart 的使用

1. 引入所需的 js 库在 <head></head>中<script src="https://ajax.googleapis.com/ajax/libs/jquery/1.11.2/jquery.min.js"></script><script type="text/javascript" src="https://

2018-05-06 10:49:48 7742

原创 计算机组成原理与体系结构 —— 南桥与北桥

南桥北桥在主板上的位置如下所示: 北桥 芯片组(chipset)的名称就是以北桥芯片的名称来命名的北桥被用来处理高速信号,通常处理CPU(处理器),RAM(内存),AGP端口或PCI Express,和南桥芯片之间的通信PCIE/AGP、Memory、CPU南桥: 南桥芯片负责I/O总线之间的通信,如PCI总线、USB、LAN、ATA、SATA、音频控制器、键盘控制器、实...

2018-05-05 20:02:43 7691

原创 (树莓派、Arduino、物联网、智能家居、机器人)传感器、机械装置、电子元件

定制 PCB1. 机械类履带底盘2. 传感器温度传感器(temperature)、湿度传感器(humidity)红外传感器(Passive Infrared)MPU6050 集成传感器模块3. 电子元件SG90舵机AD转换器4. 模块gps模块蓝牙: hc05/hc06:蓝牙串行端口通信模块;5. 外设小音响(...

2018-05-04 23:06:44 1859

原创 民族融合 —— 魏晋南北朝

0. 南北朝前奏从西晋到东晋 西晋王朝灭亡后,公元317年,镇守建康(今南京)的司马睿在江南重建晋室,史称东晋;“十六国”史称源出于北魏崔鸿所撰的《十六国春秋》:“五凉、四燕、三秦、二赵,并成、夏为十六”。 晋宣帝司马懿的曾孙武帝司马炎惠帝司马衷前秦(350年—394年)是东晋十六国时期的政权之一。元熙二年(420年),宋公刘裕废除晋安帝,建立刘宋,东晋灭亡,中国历史进入南北朝时...

2018-05-04 21:11:07 1196

原创 python opencv —— 背景提取(MOG、KNN)、识别与检测(Haar Cascade)

注意 opencv 的坐标轴,x 轴向右,和 width 对应,y 轴向下,和 height 对应;1. MOG2 与 KNNMOG:Mixture of Gaussianimport cv2cap = cv2.VideoCapture('./data/video/768x576.avi')knn_sub = cv2.createBackgroundSubtractorKN...

2018-05-01 23:01:05 3990

原创 通信 —— 串口与并口

串口与并口: 串口一次接收和发送一个 bit;并口,多个数据通路同时发送或者接收;并口并不见得一定比串口的效率来得高;名称中已包含串口之义: USB:Universal Serial BusSAS:Serial Attached SCSISATA:Serial ATAPCIe 也是串口;1. 并口通信的限制各个数据通路上的bit不要求是同步的,但在抵达接收端时,传...

2018-05-01 18:23:21 2443

原创 文物鉴赏

1. 工艺鎏金: 将金和水银合成金汞剂,涂在铜器表面,然后加热使水银蒸发,金就附着在器面不脱。错金是指一种金属丝镶嵌的工艺,用金银丝在器物的表面上镶嵌成花纹或文字。2. 瓷器五大名窑: 汝官哥钧定; 汝窑:以釉色取胜;釉色:天蓝釉; 雨过天晴云破处,者般颜色做将来;霁蓝釉;断代:元青花;机构:修内司:掌管宫殿,太庙修缮事务的机构;3. 材质...

2018-04-30 00:20:53 1031

原创 日志的处理 —— 使用 log4j

通过 log4j,日志信息不仅打印到 console,而且输出到指定文件,根据配置信息;<dependency> <groupId>log4j</groupId> <artifactId>log4j</artifactId> <version

2018-04-27 22:07:33 798

原创 pandas DataFrame 索引(iloc 与 loc 的区别)

Pandas——ix vs loc vs iloc区别0. DataFrameDataFrame 的构造主要依赖如下三个参数:data:表格数据;index:行索引;columns:列名; index 对行进行索引,columns 对列进行索引;import pandas as pd data = [[1,2,3],[4,5,6]] index = [0,1] ...

2018-04-27 22:03:57 4936

原创 pandas 数据集的端到端处理

1. 多重 sheetUsing Pandas to pd.read_excel() for multiple worksheets of the same workbookpd.read_excel() ⇒ 将 excel 的第一个 sheet 读取到 DataFrame使用 ExcelFile 对象:xls = pd.ExcelFile('excel_file_path.xls...

2018-04-26 21:53:47 896

原创 matplotlib 操作子图(subplot,axes)

Matplotlib 中文用户指南 3.3 使用 GridSpec 自定义子图位置ax:matplotlib.axes._subplots.AxesSubplot,的基本操作 ax.set_xticks([]), ax_set_yticks([]):关闭坐标刻度ax.axis('off'):关闭坐标轴ax.set_title():设置标题1. subplotsfig, ax...

2018-04-26 21:45:50 17080 1

原创 特征选择 - Filter、Wrapper、Embedded

Filter methods:information gainchi-square testfisher scorecorrelation coefficientvariance thresholdWrapper methods:recursive feature eliminationsequential feature selection algorithmsge...

2018-04-16 23:28:12 7961

原创 sklearn 下的树模型

树模型天然会对特征进行重要性排序,以分裂数据集,构建分支;1. 使用 Random Forestfrom sklearn.datasets import load_bostonfrom sklearn.ensemble import RandomForestRegressorboston_data = load_boston()X = boston_data['d...

2018-04-16 23:16:43 1712

Python-2.7.3.tgz

学习《Python 源码剖析》一书所用的 Python 源码文件。

2016-04-29

文件工具类

解决java 运行 MapReduce 相关代码时报权限错误的问题。

2016-03-15

上网日志数据(hadoop用)

简单格式的数据、

2016-03-10

matlab字幕拼接用视频截图

配套于《用matlab实现视频截图字幕部分的拼接》[http://blog.csdn.net/lanchunhui/article/details/50539019]

2016-01-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除