关闭
当前搜索:

[python爬虫] Selenium定向爬取虎扑篮球海量精美图片

作为一名从小就看篮球的球迷,会经常逛虎扑篮球及湿乎乎等论坛,在论坛里面会存在很多精美图片,包括NBA球队、CBA明星、花边新闻、球鞋美女等等,如果一张张右键另存为的话真是手都点疼了。作为程序员还是写个程序来进行吧!所以我通过Python+Selenium+正则表达式+urllib2进行海量图片爬取。最后希望读到此文的朋友,能收获一些东西,谢谢~...
阅读(5427) 评论(8)

《The C Programming Language》读书笔记总结 <一>.基础篇

写了这么多年的C代码,回过头来再看《The C Programming Language》这本书,作者Brian W. Kernighan和C语言之父Dennis M. Ritchie。感觉里面的知识和书的架构给人非常"合理"的感觉。怎么个合理法呢? 首先书中的代码,如else-if中使用binsearch函数介绍二分查找、atoi介绍字符串s转换为整数、计算器逆波兰表达式,都是实际中非常经典且常用的知识;...
阅读(2249) 评论(0)

2016届360公司PHP服务端开发笔试和面试之所得所感

这是一篇叙述自己在360公司参加笔试和面试的过程,可能面试的职位并不是你所学的方向,但是如果你能从中学到些什么或者吸取我的教训,那么作者就非常知足了。本着"学习别人是怎么失败的,活着出来的人才能成功"的目标,我从三个方面进行叙述: 第一部分:360公司笔试题 第二部分:面试过程 第三部分:注意事项及心得体会 同时,真心感谢360公司,我非常向往的一个公司。也非常感谢给我面试的那位大哥,让我真的学到了很多东西。...
阅读(6163) 评论(6)

[C/C++基础知识] 一篇就让你彻底搞懂qsort快速排序的文章

最近在做LeetCode的题目、面试和笔试后发现经常考察快速排序的知识。通过这篇文章介绍,能让你彻底的了解和学习快排,主要从一下三个部分进行介绍: 一.C语言实现qsort快速排序 二.快速排序的原理及手写快排源码 三.LeetCode关于Two Sum的快排实现 希望文章对你有所帮助~...
阅读(4522) 评论(2)

[笔试题目] 简单总结笔试和面试中的海量数据问题

最近在笔试和面试中遇到了很多关于海量数据的问题,在此进行简单的总结,写一篇方便自己下次学习的处理海量数据的相关及在线笔记,同时也希望对你有所帮助。当然,海量数据最出名的还是七月July,但这里我是想直接从实际题目出发,并参考他们那些大牛的文章及自己的想法进行简单总结。主要是Hash方法,建议大家去阅读July的文章。同时最近屠呦呦获得了中国第一个非文学的诺贝尔奖,也多么希望什么时候中国能获得以下图灵奖啊!...
阅读(3209) 评论(0)

[转载] 黄志敏:一条数据新闻是如何用7步生产出来的?

最近同学找工作,在百度搜索引擎面试时就被问到"一条新闻是如何被发现的呢?"我能想到就是实时性,某段时间内突然关注的词汇可能是新闻,再或则是通过模板打分判断。 下面这篇文章就详细讲述了一条数据新闻是如何产生的?遗憾的是没有论述如何探索一条信息是有价值的新闻。但同样希望对你有所帮助,尤其是从事搜索引擎、信息挖掘相关的专业或面试的同学。...
阅读(1285) 评论(0)

[转载] 为什么全球最好的大学大半在美国?看看美国的孩子是怎么念书的

文章对中美高等教育状况做了较深刻的描述,有助于纠正国内大学生错误的认知与学习观念,我们可以从中吸取很多经验,不仅仅局限于学习,更可以感受到他们的态度与方法,文章对于在校大学生(本科生和研究生)的指导意义很大,请广大同学耐心的读下去。 庆幸于看到这样的一篇文章,这无疑是对像我这样颓废的大学生重重的扇了一记耳光,羞愧之下谨将所得铭记于心。深表谢意。...
阅读(1528) 评论(0)

[python] 专题七.网络编程之套接字Socket、TCP和UDP通信实例

很早以前研究过C#和C++的网络通信,Python网络编程也类似。同时最近找工作笔试面试考察Socket套接字、TCP\UDP区别比较多,所以这篇文章主要精简了《Python核心编程(第二版)》第16章内容。内容包括:服务器和客户端架构、套接字Socket、TCP\UDP通信实例和常见笔试考题。文章有详细的原理及代码和运行结果,希望文章对你有所帮助,如果有不足之处,还请海涵~...
阅读(6485) 评论(5)

[笔试题目] 腾讯2015年9月基础研究笔试题

个人感觉腾讯的题目偏重数学统计概率,其中选择题就3道与程序和数据库相关,而且比较简单,更多的是数学知识;而三个大题感觉还是不错的,很贴近生活和腾讯的实际产品,让我也学到很多知识。自己需要学习的东西还是非常多,也认识到了自己很多不足之处!接下来继续努力吧。 最后希望该博客内容对你有所帮助,题目所有权归腾讯公司所有,我只是想分享给大家学习,还望贵公司海涵...
阅读(9169) 评论(5)

[python爬虫] Selenium定向爬取海量精美图片及搜索引擎杂谈

我自认为这是自己写过博客中一篇比较优秀的文章,同时也是在深夜凌晨2点满怀着激情和愉悦之心完成的。首先通过这篇文章,你能学到以下几点: 1.可以了解Python简单爬取图片的一些思路和方法 2.学习Selenium自动、测试分析动态网页和正则表达式的区别和共同点 3.了解作者最近学习得比较多的搜索引擎和知识图谱的整体框架 4.同时作者最近找工作,里面的一些杂谈和建议也许对即将成为应届生的你有所帮助 5.当然,最重要的是你也可以尝试使用这个爬虫去爬取自己比较喜欢的图片 总之,希望文章对你有所帮助。如果作者又不足...
阅读(7208) 评论(4)

[Python爬虫] 中文编码问题:raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题

最近研究搜索引擎、知识图谱和Python爬虫比较多,中文乱码问题再次浮现于眼前。虽然市面上讲述中文编码问题的文章数不胜数,但是此处还是准备简单做下笔记。方便以后查阅和大家学习。主要包括raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题。 纪伯伦曾说过:“你无法同时拥有青春和关于青春的知识;因为青春忙于生计,没有余暇去求知;而知识忙于寻求自我,无法享受生活。”同样现在找工作的我,无法在拥有扎实基础知识的同时又兼顾深度的项目理解,但我更倾向于分享知识,因为它就是寻求自我,就是...
阅读(11240) 评论(4)
    个人资料
    • 访问:2331176次
    • 积分:21632
    • 等级:
    • 排名:第412名
    • 原创:270篇
    • 转载:10篇
    • 译文:0篇
    • 评论:1652条
    个人博客
    作者:杨秀璋
    学历:本科-北京理工大学
               硕士-北京理工大学
    现任教于贵财财经大学信息学院
    http://www.eastmountyxz.com

    简介:自幼受贵州大山的熏陶,养成了诚实质朴的性格。经过寒窗苦读,考入BIT,为完成自己的教师梦,放弃IT、航天等工作,成为贵财一名大学教师,并想把自己所学所感真心传授给自己的学生,帮助更多陌生人。

    贵州纵美路迢迢,
    为负劳心此一遭。
    收得破书三四本,
    也堪将去教尔曹。

    娜美人生,醉美生活。
    他和她经历风雨,慢慢变老。
    博客专栏
    牛人博客
    最新评论