百度笔试准备
文法 https://www.cnblogs.com/yuxiuyan/p/7627371.html
MDS:前提(保持原始空间样本之间的距离和低维空间中的距离相等。)多维标度分析(multidimensional scaling ,MDS)是一组通过直观的空间图(spatial map),表示研究对象的感知和偏好的分析方法。它用多维空间中的点表示不同刺激物之间的感知或心理测量关系,这种几何表示方法称为空间图。一般认为空间图的轴代表调查对象对刺激物形成的感知和偏好心理基础或潜在维度。在市场营销方面,MDS可用于确认:1.消费者对不同品牌感知维度的数目与性质2.现有品牌在这些维度上的定位3.消费者地理想品牌在这些维度上的定位。
链接:http://pre.nowcoder.com/questionTerminal/822465b7d2824dde9de51b72588835e4?toCommentId=419935
来源:牛客网
分箱:分箱方法是一种简单常用的预处理方法,通过考察相邻数据来确定最终值。所谓“分箱”,实际上就是按照属性值划分的子区间,如果一个属性值处于某个子区间范围内,就称把该属性值放进这个子区间所代表的“箱子”内。把待处理的数据(某列属性值)按照一定的规则放进一些箱子中,考察每一个箱子中的数据,采用某种方法分别对各个箱子中的数据进行处理。在采用分箱技术时,需要确定的两个主要问题就是:如何分箱以及如何对每个箱子中的数据进行平滑处理。
分箱的方法:有4 种:等深分箱法、等宽分箱法、最小熵法和用户自定义区间法。
统一权重,也成等深分箱法,将数据集按记录行数分箱,每箱具有相同的记录数,每箱记录数称为箱子的深度。这是最简单的一种分箱方法。
统一区间,也称等宽分箱法,使数据集在整个属性值的区间上平均分布,即每个箱的区间范围是一个常量,称为箱子宽度。
用户自定义区间,用户可以根据需要自定义区间,当用户明确希望观察某些区间范围内的数据分布时,使用这种方法可以方便地帮助用户达到目的
HTTP:80 HTTPS:443 FTP:21/20 MySQL:3306 squid:3128 rsync:873 Telnet:23 DNS:53 DHCP:67/68 sshd:22 nginx:80 Tomcat:8080 sqlserver:1433 Oracle:1521 SMTP:25 Metagram:99 Netqork:119 SNMP:161 LDAP/ILS:389 DSF:55 mountd:635 sftp:115 IMAP:993 tftp:69 NFS:2049 zabbix server:10051 zabbix agent:10050 DNS:53 NTP:123 Redis:6379 MongoDB:27017
数组与线性表的区别:https://www.cnblogs.com/qinguoyi/p/10405527.html
只有一位数组是一种线性表
大顶堆升序的实现:通俗易懂https://www.cnblogs.com/lanhaicode/p/10546257.html