- 博客(4)
- 收藏
- 关注
原创 Python学习之用Requests和XPath多进程爬取有道单词数据
基础知识爬虫基本原理1、发起请求使用http库向目标站点发起请求,即发送一个RequestRequest中包含哪些内容?(1)请求方式主要是GET、POST两种类型,另外还有HEAD、PUT、DELETE、OPTIONS等。(2)请求URLURL全称是统一资源定位符,如一个网页文档、一张图片、一个视频等都可以用URL来唯一来确定(3)请求头包含请求时的头部信息,如User-...
2020-07-10 12:42:21 546
原创 Python学习之BeautifulSoup和XPath爬取英语文章和音频
和 lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。lxml 只会局部遍历,而Beautiful Soup 是基于HTML DOM(Document Object Model)的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml。BeautifulSoup 用来解析 HT...
2020-07-10 12:41:58 1027
原创 Stanford CoreNLP在Android中的使用
下载Stanford CoreNLPjar包导入与处理因为只实现部分内容,为了使apk不致过大,第二个包进行删减。解决导包的各种报错:build.gradle(app)android {//配置项目构建的各种属性 defaultConfig { ... multiDexEnabled true//解决第三方包导入报错 } //添...
2020-07-10 12:41:33 647
原创 现代通信技术之SDH技术
传送网基本概念电信网的功能基本可以归纳为两大类:传送( Transport )功能实现任何电信信息从一点到另一点或另一些点 的传递控制( Control )功能实现辅助业务和操作维护功能传送功能和控制功能并存于任何一个物理网络中。传送( Transport ):侧重于从信息传递的功能过程来描述传输( Transmission ):侧重于从信息信号通过具体物理媒质传递的物理过程来描...
2020-07-10 12:40:48 15300 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人