首先贴自己遇到的问题:
'gbk' codec can't encode character '\u20af' in position 566: illegal multibyte sequence
解决办法:http://www.cnblogs.com/feng18/p/5646925.html 这个文章很清晰。
这个解决了 print 问题,但解决不了 wirte 问题。只抓取楼主,不会出问题。
环境: python 3 + requests + beautifulsoup
另外涉及到的知识: http://blog.csdn.net/mrzhoug/article/details/51585615
抓取思路参考:http://cuiqingcai.com/993.html
成果展示: