- 博客(1)
- 资源 (5)
- 收藏
- 关注
转载 有关Python中文处理注意事项的小总结
http://python.jobbole.com/81244/ python2.x中处理中文,是一件头疼的事情。网上写这方面的文章,测次不齐,而且都会有点错误,所以在这里打算自己总结一篇文章。 我也会在以后学习中,不断的修改此篇博客。 这里假设读者已有与编码相关的基础知识,本文不再再次介绍,包括什么是utf-8,什么是unicode,它们之间有什么关系。 str与字节码 首先,我们完全
2017-09-01 11:25:13 801
MapReduce倒排索引代码
倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。带有倒排索引的文件我们称为倒排索引文件,简称倒排文件(inverted file)。
2019-03-14
刘丁酉矩阵分析
刘丁酉,出生年月1957年2月,1978年2月考入武汉测绘学院数学师资班学习基础数学,1982年1月毕业,获理学学士学位,并留校任教。1994年1月起任武汉测绘科技大学数理系副主任、主任及武汉大学数学与统计学院公共课部主任,现为武汉大学数学与统计学院基础数学系教授、硕博士生导师、湖北省优秀教师、湖北省高校数学学科跨世纪学科带头人、测绘学科在职博士生,从事现代测绘数据处理等方向的学习与研究
2019-03-14
用Python写网络爬虫.pdf
《用Python写网络爬虫》作为使用Python来爬取网络数据的杰出指南,讲解了从静态页面爬取数据的方法以及使用缓存来管理服务器负载的方法。此外,本书还介绍了如何使用AJAX URL和Firebug扩展来爬取数据,以及有关爬取技术的更多真相,比如使用浏览器渲染、管理cookie、通过提交表单从受验证码保护的复杂网站中抽取数据等。本书使用Scrapy创建了一个高级网络爬虫,并对一些真实的网站进行了爬取。
2017-09-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人