python开发实习面试感悟

昨天下午,收到某家工作室的面试通知,在万分纠结之下,就来参加面试,博主曾经在该公司附近有过一段不愉快的经历,在此就不详细叙述了。

最后参加了面试,心情还是比较平静的。一共问了四方面的问题:

1.机器学习主要有哪些算法?简单介绍下,讲解一下。

机器学习主要分为监督学习和无监督学习,监督学习主要有推荐引擎,回归和分类;无监督学习主要分为聚类,降维和文本处理。

http://blog.csdn.net/jim_cainiaoxiaolang/article/details/51787370,在该文中对于机器学习的算法做了详细的学习。

2.java中对象创建的几种方法:
1).使用new关键字
2).使用clone方法
3).反射机制
4).反序列化
以上四种都可以产生java对象
1,3都会明确的显式的调用构造函数
2是在内存上对已有对象的影印 所以不会调用构造函数
4是从文件中还原类的对象 也不会调用构造函数

3.python的排序和去重


1)排序:List进行排序,

方法1.用List的内建函数list.sort进行排序

list.sort(func=None, key=None, reverse=False) 

Python实例:

1
2
3
4
5
6
>>>  list  =  [ 2 , 5 , 8 , 9 , 3 ]  
>>>  list  
[ 2 , 5 , 8 , 9 , 3 ]  
>>>  list .sort()  
>>>  list  
[ 2 3 5 8 9 ]
方法2.用序列类型函数sorted(list)进行排序(从2.4开始)

Python实例:

1
2
3
4
5
>>>  list  =  [ 2 , 5 , 8 , 9 , 3 ]  
>>>  list  
[ 2 , 5 , 8 , 9 , 3 ]  
>>>  sorted ( list )  
[ 2 3 5 8 9 ]
两种方法的区别:

sorted(list)返回一个对象,可以用作表达式。原来的list不变,生成一个新的排好序的list对象。

list.sort() 不会返回对象,改变原有的list提供了两个方法。

2)去重

set()

最简单的思路就是:

 代码如下:

ids = [1,2,3,3,4,2,3,4,5,6,1]
news_ids = []
for id in ids:
    if id not in news_ids:
        news_ids.append(id)

print news_ids

这样也可行,但是看起来不够爽。

用set

另外一个解决方案就是用set:

 代码如下:
ids = [1,4,3,3,4,2,3,4,5,6,1]
ids = list(set(ids))

这样的结果是没有保持原来的顺序。

按照索引再次排序

最后通过这种方式解决:

 代码如下:
ids = [1,4,3,3,4,2,3,4,5,6,1]
news_ids = list(set(ids))
news_ids.sort(ids.index)

使用itertools.grouby

文章一开始就提到itertools.grouby, 如果不考虑列表顺序的话可用这个:

 代码如下:
ids = [1,4,3,3,4,2,3,4,5,6,1]
ids.sort()
it = itertools.groupby(ids)

for k, g in it:
    print k

关于itertools.groupby的原理可以看这里:http://docs.python.org/2/library/itertools.html#itertools.groupby

用reduce

代码如下:

In [5]: ids = [1,4,3,3,4,2,3,4,5,6,1]

In [6]: func = lambda x,y:x if y in x else x + [y]

In [7]: reduce(func, [[], ] + ids)
Out[7]: [1, 4, 3, 2, 5, 6]

在ipython中运行的代码,其中的 lambda x,y:x if y in x else x + [y] 等价于 lambda x,y: y in x and x or x+[y] 。

4.java中常见的集合类机简单实现

一.Set集合,其主要实现类有HashSet、TreeSet。存放对象的引用,不允许有重复对象。

通过java的equals()方法判别。如果有特殊需求须重载equals()方法。
1、HashSet(),调用对象的hashCode()方法,获得哈希码,然后再集合中计算存放对象的位置。通过比较哈希码与equals()方法来判别是否重复。所以,重载了equals()方法同时也要重载hashCode()方法。
2、TreeSet(),继承ShortedSet接口,能够对集合中对象排序。默认排序方式是自然排序,但该方式只能对实现了Comparable接口的对象排序,java中对Integer、Byte、Double、Character、String等数值型和字符型对象都实现了该接口。
如果有特殊排序,须重载该接口下的compareTo()方法或通过Comparator接口的实现类构造集合。
二、List集合,其主要实现类有LinkedList、ArrayList,前者实现了链表结构,后者可代表大小可变的数组。List的特点是能够以线性方式储蓄对象,并允许存放重复对象。List能够利用Collections类的静态方法sort排序。sort(List list)自然排序;sort(List listm,Comparator comparator)客户化排序。
三、Map集合,其主要实现类有HashMap、TreeMap。Map对值没有唯一性要求,对健要求唯一,如果加入已有的健,原有的值对象将被覆盖。HashMap类按照哈希算法来存取键对象,可以重载equals()、hashCode()方法来比较键,但是两者必须一致。TreeMap,可自然排序,也可通过传递Comparator的实现类构造TreeMap。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值