今天dr. wang又发来两封邮件,是一个关于万方数据库(wanfangdata)的爬虫程序。
2号他给我发了一个带前台界面的爬虫,也是.net写的。由于机器上没有安装visual studio,系统报告说缺少.net framework 2.0 ,没办法,把两个多G的大笨家伙弄下来装上了。
结果事情并不是很顺利,对于像我这种之前只用过vb、vc、delphi、JVM其中简单几个工具的人来说,用vs打开工程后映入眼帘的第一个提示就把我难住了:“初始化 microsoft visual sourcesafe 源代码管理提供程序时失败”。心想是不是又要有一番苦斗了……行了,问题是基本问题。打开google一搜就清楚了。而且这个也促使我了解了什么是版本控制,版本控制是做什么的。
dr. wang在邮件里嘱咐了三件事:1、将今天发来的wanfang crawler程序弄懂(他说这是原来在学校弄的,从功能角度讲只是开了个头…… -_-''老师说话还犹抱琵琶半遮面,目的还不是找几个马铃薯帮忙添砖加瓦呢……)。2、将他指定的一个网页给爬下来(……说到这儿很郁闷,他2号发给我的那程序,我已经把自己的博客给扒拉下来了,本来硬盘已经吃紧了……)。3、有问题但说无妨,并祝新春快乐(俺就没想过藏着掖着lol,不过还得谢谢老师的关心啦)。
日后可能问题就多了,我也不可能一一准确描述出来,可能迷迷糊糊就绕过去了。不过只要是自个儿觉得不错的,就得赶紧整理出来发到这里,以后这里可是俺的智囊库咯~~