杨秀璋的专栏

无知 · 乐观 · 谦逊 · 低调 · 生活

[python爬虫] Selenium定向爬取虎扑篮球海量精美图片

作为一名从小就看篮球的球迷,会经常逛虎扑篮球及湿乎乎等论坛,在论坛里面会存在很多精美图片,包括NBA球队、CBA明星、花边新闻、球鞋美女等等,如果一张张右键另存为的话真是手都点疼了。作为程序员还是写个程序来进行吧!所以我通过Python+Selenium+正则表达式+urllib2进行海量图片爬取...

2015-10-25 03:00:47

阅读数:6134

评论数:8

《The C Programming Language》读书笔记总结 <一>.基础篇

写了这么多年的C代码,回过头来再看《The C Programming Language》这本书,作者Brian W. Kernighan和C语言之父Dennis M. Ritchie。感觉里面的知识和书的架构给人非常"合理"的感觉。怎么个合理法呢? 首先书中的代码,如else...

2015-10-21 16:14:47

阅读数:2799

评论数:0

2016届360公司PHP服务端开发笔试和面试之所得所感

这是一篇叙述自己在360公司参加笔试和面试的过程,可能面试的职位并不是你所学的方向,但是如果你能从中学到些什么或者吸取我的教训,那么作者就非常知足了。本着"学习别人是怎么失败的,活着出来的人才能成功"的目标,我从三个方面进行叙述: 第一部分:360公司笔试题 第二部分:面试过程...

2015-10-17 02:11:05

阅读数:7370

评论数:6

[C/C++基础知识] 一篇就让你彻底搞懂qsort快速排序的文章

最近在做LeetCode的题目、面试和笔试后发现经常考察快速排序的知识。通过这篇文章介绍,能让你彻底的了解和学习快排,主要从一下三个部分进行介绍: 一.C语言实现qsort快速排序 二.快速排序的原理及手写快排源码 三.LeetCode关于Two S...

2015-10-11 05:45:39

阅读数:6304

评论数:2

[笔试题目] 简单总结笔试和面试中的海量数据问题

最近在笔试和面试中遇到了很多关于海量数据的问题,在此进行简单的总结,写一篇方便自己下次学习的处理海量数据的相关及在线笔记,同时也希望对你有所帮助。当然,海量数据最出名的还是七月July,但这里我是想直接从实际题目出发,并参考他们那些大牛的文章及自己的想法进行简单总结。主要是Hash方法,建议大家去...

2015-10-08 06:16:03

阅读数:3954

评论数:0

[转载] 黄志敏:一条数据新闻是如何用7步生产出来的?

最近同学找工作,在百度搜索引擎面试时就被问到"一条新闻是如何被发现的呢?"我能想到就是实时性,某段时间内突然关注的词汇可能是新闻,再或则是通过模板打分判断。 下面这篇文章就详细讲述了一条数据新闻是如何产生的?遗憾的是没有论述如何探索一条信息是有价值的新闻。但同样希望对你有所帮助...

2015-10-05 22:36:11

阅读数:1440

评论数:0

[转载] 为什么全球最好的大学大半在美国?看看美国的孩子是怎么念书的

文章对中美高等教育状况做了较深刻的描述,有助于纠正国内大学生错误的认知与学习观念,我们可以从中吸取很多经验,不仅仅局限于学习,更可以感受到他们的态度与方法,文章对于在校大学生(本科生和研究生)的指导意义很大,请广大同学耐心的读下去。 庆幸于看到这样的一篇文章,这无疑是对像我这样颓废的大学生重重的扇...

2015-10-05 21:55:01

阅读数:1731

评论数:0

[python] 专题七.网络编程之套接字Socket、TCP和UDP通信实例

很早以前研究过C#和C++的网络通信,Python网络编程也类似。同时最近找工作笔试面试考察Socket套接字、TCP\UDP区别比较多,所以这篇文章主要精简了《Python核心编程(第二版)》第16章内容。内容包括:服务器和客户端架构、套接字Socket、TCP\UDP通信实例和常见笔试考题。文...

2015-10-05 08:40:19

阅读数:7759

评论数:5

[笔试题目] 腾讯2015年9月基础研究笔试题

个人感觉腾讯的题目偏重数学统计概率,其中选择题就3道与程序和数据库相关,而且比较简单,更多的是数学知识;而三个大题感觉还是不错的,很贴近生活和腾讯的实际产品,让我也学到很多知识。自己需要学习的东西还是非常多,也认识到了自己很多不足之处!接下来继续努力吧。 最后希望该博客内容对你有所帮助,题目所有...

2015-10-04 20:58:12

阅读数:10260

评论数:7

[python爬虫] Selenium定向爬取海量精美图片及搜索引擎杂谈

我自认为这是自己写过博客中一篇比较优秀的文章,同时也是在深夜凌晨2点满怀着激情和愉悦之心完成的。首先通过这篇文章,你能学到以下几点: 1.可以了解Python简单爬取图片的一些思路和方法 2.学习Selenium自动、测试分析动态网页和正则表达式的区别和共同点 3.了解作者最近学习得比较多的搜索引...

2015-10-02 09:47:38

阅读数:8289

评论数:4

[Python爬虫] 中文编码问题:raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题

最近研究搜索引擎、知识图谱和Python爬虫比较多,中文乱码问题再次浮现于眼前。虽然市面上讲述中文编码问题的文章数不胜数,但是此处还是准备简单做下笔记。方便以后查阅和大家学习。主要包括raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题。 纪伯伦曾说过:“你无法同...

2015-10-01 22:46:37

阅读数:13025

评论数:4

提示
确定要删除当前文章?
取消 删除
关闭
关闭