1.搞懂你所要处理的网页的执行的逻辑过程
——【教程】手把手教你如何利用工具(IE9的F12)去分析模拟登陆网站(百度首页)的内部逻辑过程
http://www.crifan.com/use_ie9_f12_to_analysis_the_internal_logical_process_of_login_baidu_main_page_website/
2.想要从某静态网页中,提取某些内容
http://www.crifan.com/crawl_website_html_and_extract_info_using_python/
3.以抓取网易博客帖子中的最近读者信息为例,手把手教你如何抓取动态网页中的内容
http://www.crifan.com/example_to_crawl_dynamic_webpage_content_of_recent_reader_info_for_netease_blog_post/