昨天下午,收到某家工作室的面试通知,在万分纠结之下,就来参加面试,博主曾经在该公司附近有过一段不愉快的经历,在此就不详细叙述了。
最后参加了面试,心情还是比较平静的。一共问了四方面的问题:
1.机器学习主要有哪些算法?简单介绍下,讲解一下。
机器学习主要分为监督学习和无监督学习,监督学习主要有推荐引擎,回归和分类;无监督学习主要分为聚类,降维和文本处理。
http://blog.csdn.net/jim_cainiaoxiaolang/article/details/51787370,在该文中对于机器学习的算法做了详细的学习。
2.java中对象创建的几种方法:
1).使用new关键字
2).使用clone方法
3).反射机制
4).反序列化
以上四种都可以产生java对象
1,3都会明确的显式的调用构造函数
2是在内存上对已有对象的影印 所以不会调用构造函数
4是从文件中还原类的对象 也不会调用构造函数
3.python的排序和去重
1)排序:List进行排序,
方法1.用List的内建函数list.sort进行排序
list.sort(func=None, key=None, reverse=False)
Python实例:
1
2
3
4
5
6
|
>>>
list
=
[
2
,
5
,
8
,
9
,
3
]
>>>
list
[
2
,
5
,
8
,
9
,
3
]
>>>
list
.sort()
>>>
list
[
2
,
3
,
5
,
8
,
9
]
|
方法2.用序列类型函数sorted(list)进行排序(从2.4开始)
Python实例:
1
2
3
4
5
|
>>>
list
=
[
2
,
5
,
8
,
9
,
3
]
>>>
list
[
2
,
5
,
8
,
9
,
3
]
>>>
sorted
(
list
)
[
2
,
3
,
5
,
8
,
9
]
|
两种方法的区别:
sorted(list)返回一个对象,可以用作表达式。原来的list不变,生成一个新的排好序的list对象。
list.sort() 不会返回对象,改变原有的list提供了两个方法。2)去重
set()
最简单的思路就是:
ids = [1,2,3,3,4,2,3,4,5,6,1]
news_ids = []
for id in ids:
if id not in news_ids:
news_ids.append(id)
print news_ids
这样也可行,但是看起来不够爽。
用set
另外一个解决方案就是用set:
ids = [1,4,3,3,4,2,3,4,5,6,1]
ids = list(set(ids))
这样的结果是没有保持原来的顺序。
按照索引再次排序
最后通过这种方式解决:
ids = [1,4,3,3,4,2,3,4,5,6,1]
news_ids = list(set(ids))
news_ids.sort(ids.index)
使用itertools.grouby
文章一开始就提到itertools.grouby, 如果不考虑列表顺序的话可用这个:
ids = [1,4,3,3,4,2,3,4,5,6,1]
ids.sort()
it = itertools.groupby(ids)
for k, g in it:
print k
关于itertools.groupby的原理可以看这里:http://docs.python.org/2/library/itertools.html#itertools.groupby
用reduce
代码如下:In [5]: ids = [1,4,3,3,4,2,3,4,5,6,1]
In [6]: func = lambda x,y:x if y in x else x + [y]
In [7]: reduce(func, [[], ] + ids)
Out[7]: [1, 4, 3, 2, 5, 6]
4.java中常见的集合类机简单实现
一.Set集合,其主要实现类有HashSet、TreeSet。存放对象的引用,不允许有重复对象。
通过java的equals()方法判别。如果有特殊需求须重载equals()方法。
1、HashSet(),调用对象的hashCode()方法,获得哈希码,然后再集合中计算存放对象的位置。通过比较哈希码与equals()方法来判别是否重复。所以,重载了equals()方法同时也要重载hashCode()方法。
2、TreeSet(),继承ShortedSet接口,能够对集合中对象排序。默认排序方式是自然排序,但该方式只能对实现了Comparable接口的对象排序,java中对Integer、Byte、Double、Character、String等数值型和字符型对象都实现了该接口。
如果有特殊排序,须重载该接口下的compareTo()方法或通过Comparator接口的实现类构造集合。
二、List集合,其主要实现类有LinkedList、ArrayList,前者实现了链表结构,后者可代表大小可变的数组。List的特点是能够以线性方式储蓄对象,并允许存放重复对象。List能够利用Collections类的静态方法sort排序。sort(List list)自然排序;sort(List listm,Comparator comparator)客户化排序。
三、Map集合,其主要实现类有HashMap、TreeMap。Map对值没有唯一性要求,对健要求唯一,如果加入已有的健,原有的值对象将被覆盖。HashMap类按照哈希算法来存取键对象,可以重载equals()、hashCode()方法来比较键,但是两者必须一致。TreeMap,可自然排序,也可通过传递Comparator的实现类构造TreeMap。