![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
sunshinwong
这个作者很懒,什么都没留下…
展开
-
Python爬虫入门
最新学习Python,以爬虫作为练手的工具来开发。Python提供了urllib用于抓取网页的内容,十分的简单。再配合正则表达式或者HTML解析包,可以十分容易的实现爬虫,但是若开发大数据的则需要到分布式的爬虫,此处暂且不提。首先提供一个简单的抓取单页内容的示例程序,并演示正则表达式的使用方法;示例如下:#encoding:UTF-8import urllib.requestimp原创 2015-01-04 15:54:14 · 651 阅读 · 0 评论 -
Python3 中文使用以及中文乱码问题
Python3中默认的字符编码格式即Utf-8,Python2中采用u'中文'的方式,不再支持。字符串转码方法:str.encode('转码的格式'),例如str.encode('GBK')其他格式的字节流转码成str(utf-8):bytes.decode('utf-8')。Python一直没有方便的IDE,但是微软除了Python插件后,提供了很大的便利。但是在VS中使用中原创 2015-06-09 16:52:21 · 9920 阅读 · 0 评论