2015年11月_ShenYounger

转载怎样看待 12 个月内自学完成 4 年麻省理工学院计算机科学的 33 门课程的 Scott H. Young 所谓的超速学习理论和方法（费曼技巧）以及背后「Get More from Life」的理念

转自知乎。原问题为：怎样看待 12 个月内自学完成 4 年麻省理工学院计算机科学的 33 门课程的 Scott H. Young 所谓的超速学习理论和方法（费曼技巧）以及背后「Get More from Life」的理念？战隼回答：著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。作者：warfalcon链接：http://www.zhihu.

2015-11-23 15:43:40 3897

原创 EMC的一道数字编程编程题

版权归EMC所有。解题思路：此道题目的解题要点有两点。第一，利用进位的思想，如果当前位没有办法通过修改当前位数字为3或5使得修改后的数字比原来的数字大，则需要进位。第二，如果当前位修改后的数字比它原来的数字大，则要将当前位以后的数字全部置为3。详细情况，参看代码注释。import java.util.Scanner;public class Copy_2_of_Main

2015-11-22 16:47:36 490

原创需要看的书以及需要了解的知识

1.虚函数，继承。C++2.shell 命令。3.shell 脚本正则表达式。4.

2015-11-21 21:50:25 397

原创 C风格字符串中需要注意的一点

C风格字符串C风格字符串是用字符型数组存储的，字符串要求其尾部以’\0’作为结束标志。如： char string[ ]=”C++ programming language”;用sizeof来测string长度为25个字节，而实际串本身长度(含空格)为24个字节，多出来的一个就是串结束符’\0’(含0)。printf("%d",sizeof("abc"))的输出为4，

2015-11-21 19:54:52 398

转载 strcpy与strncpy的区别

首先看c++ reference中关于strcpy与strncpy的详细说明。参看http://www.cplusplus.com/reference/cstring/strcpy/和http://www.cplusplus.com/reference/cstring/strncpy/。其次在stackoverflow上有一个相关问题：问题：Edit:

2015-11-21 15:44:02 472

原创 C++ sizeof 使用规则及陷阱分析

1、什么是sizeof 　　首先看一下sizeof在msdn上的定义：　　The sizeof keyword gives the amount of storage, in bytes, associated with a variable or a type (including aggregate types). This keyword returns a value o

2015-11-21 15:24:47 491

原创 EMC 2016笔试题

1.快速排序最好的时间复杂度是多少？解答：最好和平均时间复杂度都是O(nlogn)，最坏时间复杂度为O(n^2)。快速排序的最好时间复杂度是 O(nlgn) 。快速排序的思路是：使用一个值 v 将原有序列分成小于 v 的左半部分、大于 v 的右半部分，然后对左右递归处理。理想的情况是，左右划分比较均匀，所以有递推式：T(n) = 2T(n/2) + n，这个递推式的通项公式 T(n)

2015-11-20 17:33:26 1194 3

转载二叉树中两个节点的最近公共父节点

这个问题可以分为三种情况来考虑：情况一：root未知，但是每个节点都有parent指针此时可以分别从两个节点开始，沿着parent指针走向根节点，得到两个链表，然后求两个链表的第一个公共节点，这个方法很简单，不需要详细解释的。情况二：节点只有左、右指针，没有parent指针，root已知思路：有两种情况，一是要找的这两个节点（a, b），在要遍历的节点（root）的两侧，那么这

2015-11-20 00:02:17 902

转载 Lowest Common Ancestor in a Binary Search Tree.

Given values of two nodes in a Binary Search Tree, write a c program to find the Lowest Common Ancestor (LCA). You may assume that both the values exist in the tree.The function prototype should

2015-11-19 23:50:00 307

转载 Lowest Common Ancestor in a Binary Tree

原文转自http://www.geeksforgeeks.org/lowest-common-ancestor-binary-tree-set-1/Given a binary tree (not a binary search tree) and two values say n1 and n2, write a program to find the least common an

2015-11-19 22:10:55 499

转载 How should 50 red and 50 blue marbles be distributed between two jars so as to maximize the chance o

Graduates on the 'i fucking love science group' are again debating this. Please show all your working:You have 50 red marbles, 50 blue marbles and 2 jars.Your friend will be randomly grabbing on

2015-11-17 16:50:22 562

转载 map与unordered_map的区别与选择

下面的解答出自stackoverflow。1.I think it's obvious that you'd use the std::map you need to iterate across items in the map in sorted order.You might also use it when you'd prefer to writea comp

2015-11-16 23:50:45 617

转载多元函数极值及其求法

§8.8 多元函数极值及其求法一、多元函数的极值1、多元函数极值定义设函数在点的某个邻域内有定义,对该邻域内异于的点,如果都适合不等式则称函数在点取极大值；如果都适合不等式则称函数在点取极小值。极大值与极小值统称为函数的极值；使函数取得极值的点称为极值点。注:二元函数的极值是一个局部概念,这一概念很容易推广至多元函数。【例1】讨论下述函数在原点是否取得

2015-11-13 21:02:18 50397 7

转载为什么一些机器学习模型需要对数据进行归一化？

机器学习模型被互联网行业广泛应用，如排序（参见：排序学习实践）、推荐、反作弊、定位（参见：基于朴素贝叶斯的定位算法）等。一般做机器学习应用的时候大部分时间是花费在特征处理上，其中很关键的一步就是对特征数据进行归一化，为什么要归一化呢？很多同学并未搞清楚，维基百科给出的解释：1）归一化后加快了梯度下降求最优解的速度；2）归一化有可能提高精度。下面我简单扩展解释下这两点。1 归一化为什么能提高

2015-11-09 20:05:47 878

转载 Feature scaling

From Wikipedia, the free encyclopediaFeature scaling is a method used to standardize the range of independent variables or features of data. In data processing, it is also known as data no

2015-11-09 20:05:09 598

转载 RBF SVM中的gamma和C参数

This example illustrates the effect of the parameters gamma and C of the Radial Basis Function (RBF) kernel SVM.Intuitively, the gamma parameter defines how far the influence of a single trainin

2015-11-09 13:42:22 7036

转载 Ackerman函数

维基百科：阿克曼函数http://zh.wikipedia.org/wiki/%E9%98%BF%E5%85%8B%E6%9B%BC%E5%87%BD%E6%95%B8阿克曼函数是非原始递归函数的例子；它需要两个自然数作为输入值，输出一个自然数。它的输出值增长速度非常高，仅是(4,3)的输出已大得不能准确计算。1920年代后期，数学家大卫·希尔伯特的学生Gabriel Su

2015-11-08 21:32:17 513

转载 C语言位域(位段)

有些信息在存储时，并不需要占用一个完整的字节，而只需占几个或一个二进制位。例如开关只有通电和断电两种状态，用0和1表示足以，也就是用一个二进位。所以C语言又提供了一种数据结构，称为位域或位段。位域在应用开发中较少使用，你可以暂时跳过，遇到相关问题再回来温习。所谓“位域”是把一个字节中的二进位划分为几个不同的区域，并说明每个区域的位数。每个区域有一个域名，允许在程序中按域名进行操作。

2015-11-08 20:36:34 490

原创高度为H的AVL树最少节点数

在这里，我们用f(h)代表高度为h的AVL树最少的节点数。由此，我们知道f(0)=0, f(1)=1, f(2)=2。当AVL树的高度为h，并且要保证此树满足AVL树的性质(即左右子树的高度相差不超过1)时，我们假设左子树的高度为h-1，则右子树的高度为h-2。因此得到如下递归公式f(h)=f(h-1)+f(h-2)+1。因此可知f(3)=4, f(4)=7。。。

2015-11-08 17:24:18 20282 5

转载 C语言枚举类型

实际问题中，有些变量的取值被限制在一定范围内。例如，一个星期内只有七天，一年只有十二个月，一个班每周有六门课程等。C语言提供了一种枚举（Enum）类型，可以列出所有可能的取值。定义形式为：enum 变量名{ 枚举值列表 };这些值也称为枚举元素。注意最后的分号;不能少。例如，列出一个星期有几天：enum week{sun, mon, tue, wed, thu, f

2015-11-08 12:43:23 610

原创 2016大唐移动在线笔试题

1. 5 24 61 122 213 数字序列的下面一个数是什么？解答：340，以上数字同加上3后，得到8，27，64，125，216，分别是2，3，4，5，6的立方，所以下面的数应该是7³-3=340。2.下面的代码，输出是什么？int main () { int x = 5, y = 6; printf("%%d, %%d", x, y); retu

2015-11-08 12:13:17 4720 1

转载同学论文投递的那些会议

1.同学小霍投递的是www会议。International World Wide Web Conference，每年召开一次。是计算机的顶级学术会议2.同学小胡投递的是中文信息学会2015学术年会。每年一次。

2015-11-06 23:25:01 487

转载 NLP的派别

主要由两派。一派是基于规则的理性主义，一派是基于统计的经验主义。

2015-11-06 23:09:32 662

昨天实验室一位刚进组的同学发邮件来问我如何查找学术论文，这让我想起自己刚读研究生时茫然四顾的情形：看着学长们高谈阔论领域动态，却不知如何入门。经过研究生几年的耳濡目染，现在终于能自信地知道去哪儿了解最新科研动态了。我想这可能是初学者们共通的困惑，与其只告诉一个人知道，不如将这些Folk Knowledge写下来，来减少更多人的麻烦吧。当然，这个总结不过是一家之谈，只盼有人能从中获得一点点益处，受个

2015-11-06 23:06:39 511

转载国内NLP的那些人那些会

统计学和语言学专家都列在一起了，没有区分。1，黄昌宁，1937年生于广东，1955年考入清华大学电机系，1961年毕业并留校任教至博士生导师， 1983-1984年赴美国耶鲁大学进修，1986-1987年曾在香港理工大学任教，1999年4月加入微软中国研究院任主任研究员。中国计算机自然语言处理领域的”趟路人”和集大成者。2，孙茂松，清华大学计算机科学与技术系系主任，教授，博士生导师。研究方

2015-11-06 22:54:29 18022

转载 SVM的两个参数 C 和 gamma

SVM模型有两个非常重要的参数C与gamma。其中 C是惩罚系数，即对误差的宽容度。c越高，说明越不能容忍出现误差,容易过拟合。C越小，容易欠拟合。C过大或过小，泛化能力变差 gamma是选择RBF函数作为kernel后，该函数自带的一个参数。隐含地决定了数据映射到新的特征空间后的分布，gamma越大，支持向量越少，gamma值越小，支持向量越多。支持向量的个数影响训练

2015-11-06 13:15:34 39470 12

原创关于SVM中的几点解惑

之前曾经在知乎上问过一个ml phd几个问题，问题如下：1.SVM模型中，假如通过高斯核这样的可以把样本空间向无限多维映射的核函数，映射之后，样本空间一定可分么？之所以有这个疑惑，是因为我曾经记得有一个老师说：无论样本空间多么不可分，只要映射的维数足够高，就一定可分。解答：高斯核函数的确是把样例映射到无限多维，并且也一定可以使得样例线性可分(不过这里有一个前提，前提就是同样的样例不能即既被

2015-11-06 12:24:56 1093

转载 SVM入门（九）松弛变量（续）

本文出自http://www.blogjava.net/zhenandaci/archive/2009/03/17/260315.html 作者为嘉士嘉士伯的Java小屋接下来要说的东西其实不是松弛变量本身，但由于是为了使用松弛变量才引入的，因此放在这里也算合适，那就是惩罚因子C。回头看一眼引入了松弛变量以后的优化问题：注意其中C的位置，也可以回想一下C所起的作

2015-11-05 23:23:58 426

转载关于惩罚因子C

惩罚因子C不是一个变量，整个优化问题在解的时候，C是一个你必须事先指定的值，指定这个值以后，解一下，得到一个分类器，然后用测试数据看看结果怎么样，如果不够好，换一个C的值，再解一次优化问题，得到另一个分类器，再看看效果，如此就是一个参数寻优的过程，但这和优化问题本身决不是一回事，优化问题在解的过程中，C一直是定值，要记住。

2015-11-05 13:56:55 6529

转载 SVM入门（八）松弛变量

现在我们已经把一个本来线性不可分的文本分类问题，通过映射到高维空间而变成了线性可分的。就像下图这样：圆形和方形的点各有成千上万个（毕竟，这就是我们训练集中文档的数量嘛，当然很大了）。现在想象我们有另一个训练集，只比原先这个训练集多了一篇文章，映射到高维空间以后（当然，也使用了相同的核函数），也就多了一个样本点，但是这个样本的位置是这样的：就是图中黄色

2015-11-05 13:54:43 563

转载 SVM松弛变量

我们之前讨论的情况都是建立在样例线性可分的假设上，当样例线性不可分时，我们可以尝试使用核函数来将特征映射到高维，这样很可能就可分了。然而，映射后我们也不能100%保证可分。???那怎么办呢，我们需要将模型进行调整，以保证在不可分的情况下，也能够尽可能地找出分隔超平面。看下面两张图：可以看到一个离群点（可能是噪声）可以造成超平面的移动，间隔缩小，可见以前的模型对噪声非常敏感。

2015-11-05 12:56:51 7960 2

转载 assert()函数用法

assert宏的原型定义在中，其作用是如果它的条件返回错误，则终止程序执行，原型定义：#include void assert( int expression );　assert的作用是现计算表达式 expression ，如果其值为假（即为0），那么它先向stderr打印一条出错信息，然后通过调用 abort 来终止程序运行。请看下面的程序清单badptr.c：#include

2015-11-04 22:20:22 357

转载深入理解指针函数

1.指针函数的定义顾名思义，指针函数即返回指针的函数。其一般定义形式如下：类型名 *函数名(函数参数表列); 其中，后缀运算符括号“()”表示这是一个函数，其前缀运算符星号“*”表示此函数为指针型函数，其函数值为指针，即它带回来的值的类型为指针，当调用这个函数后，将得到一个“指向返回值为…的指针（地址），“类型名”表示函数返回的指针指向的类型”。

2015-11-04 22:15:23 268

转载 C语言函数名与函数指针详解

一、通常的函数调用一个通常的函数调用的例子：/* 自行包含头文件 */void MyFun(int x); /* 此处的声明也可写成：void MyFun(int) */int main(int argc, char* argv[]){ MyFun(10); /* 这里是调用MyFun(10) 函数 */ return(0);}void MyFun(in

2015-11-04 21:51:52 284

转载动态链接库DLL的加载：隐式加载(载入时加载)和显式加载(运行时加载)

静态链接库在链接时，编译器会将 .obj 文件和 .LIB 文件组织成一个 .exe 文件，程序运行时，将全部数据加载到内存。如果程序体积较大，功能较为复杂，那么加载到内存中的时间就会比较长，最直接的一个例子就是双击打开一个软件，要很久才能看到界面。这是静态链接库的一个弊端。动态链接库有两种加载方式：隐式加载和显示加载。隐式加载又叫载入时加载，指在主程序载入内存时搜索D

2015-11-04 19:59:28 353

转载第一个DLL程序：动态链接库DLL教程，30分钟快速上手

DLL 程序的入口函数是 DllMain()，就像 DOS 程序的入口函数是 main()、Win32 程序的入口函数是 WinMain() 一样。前面我们一直在讲的就是DOS程序。DllMain() 函数的原型为：BOOL APIENTRY DllMain( HANDLE hModule, DWORD ul_reason_for_call, LPVOID

2015-11-04 18:05:22 397

转载折半插入快速

基本概念折半插入排序（binary insertion sort）是对插入排序算法的一种改进，由于排序算法过程中，就是不断的依次将元素插入前面已排好序的序列中。由于前半部分为已排好序的数列，这样我们不用按顺序依次寻找插入点，可以采用折半查找的方法来加快寻找插入点的速度。算法思想在将一个新元素插入已排好序的数组的过程中，寻找插入点时，将待插入区域的首元素设置为a[low]，末

2015-11-04 17:42:03 369

转载动态链接库(dll)简介

DLL 是 Dynamic Link Library 的缩写，译为“动态链接库”。DLL也是一个被编译过的二进制程序，可以被其他程序调用，但与 exe 不同，DLL不能独立运行，必须由其他程序调用载入内存。DLL 中封装了很多函数，只要知道函数的入口地址，就可以被其他程序调用。Windows API中所有的函数都包含在DLL中，其中有3个最重要的DLL：Kemel32.

2015-11-04 16:36:06 341

原创常见的生成模型

混合高斯模型和其他混合模型隐马尔可夫模型随机上下文无关文法朴素贝叶斯分类器AODE分类器潜在狄利克雷分配模型有限波尔兹曼机

2015-11-04 09:25:38 1116

中文分词-北大常宝宝

空空如也