- 博客(7)
- 资源 (2)
- 收藏
- 关注
原创 【爬虫工具】下载博客转成Markdown的形式
简单的爬虫工具 下载博客,并转成Markdown的形式为什么要写这个工具 主要是为了收集好的网上资源,每次看到一篇好的文章就像保存下来,但是保存网页的可读性太差了,如果转换成Markdown的形式就很舒服。但是网页中会有许多无聊的标签干扰,于是写个简单的工具使用的python库beautifulsoup4requestshtml2text目录csdn.py csdn博客爬虫j
2018-01-28 15:04:30 1300
原创 爬虫第一步,网络信息采集
自己爬虫经验总结 项目地址网络信息采集在编写爬虫之前可能需要先了解和搜集网站信息robots.txt Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。一般的网站都会有这个文件。可以大致了解这个网站存在哪些限制下面是知乎的robots.tx
2018-01-25 20:32:46 2492 2
原创 拉勾网数据爬取
拉勾网数据爬取爬取内容北京数据挖掘方向的岗位数据方案正常的https://www.lagou.com/jobs/list_数据挖掘?px=new&city=上海#order上面的URL是查询上海数据挖掘岗位的信息并按照最新发布排序 通过抓包分析请求的真正URL是这个https://www.lagou.com/jobs/positionAjax.json
2018-01-22 22:14:24 8236 4
原创 Dijkstra算法Python实现
Dijkstra算法迪杰斯特拉算法是由荷兰计算机科学家狄克斯特拉于1959 年提出的,因此又叫狄克斯特拉算法。是从一个顶点到其余各顶点的最短路径算法,解决的是有向图中最短路径问题。迪杰斯特拉算法主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。算法"""输入graph 输入的图src 原点返回dis 记录源点到其他点的最短距离path 路径"""import j
2018-01-04 19:11:42 3185 1
原创 解释性语言和编译性语言
解释性语言和编译性语言的定义: 计算机不能直接理解高级语言,只能直接理解机器语言,所以必须要把高级语言翻译成机器语言,计算机才能执行高级语言编写的程序。 翻译的方式有两种,一个是编译,一个是解释。两种方式只是翻译的时间不同。解释性语言的定义: 解释性语言的程序不需要编译,在运行程序的时候才翻译,每个语句都是执行的时候才翻译。这样解释性语言每执行一次就需要逐行翻译一次,效率比较低。 现代
2018-01-04 12:35:08 1402
原创 Ubuntu 16.04源码安装最新版Mininet
Mininet 是一个轻量级软件定义网络和测试平台;它采用轻量级的虚拟化技术使一个单一的系统看起来像一个完整的网络运行相关的内核系统和用户代码,也可简单理解为 SDN 网络系统中的一种基于进程虚拟化平台,它支持 OpenFlow、OpenvSwith 等各种协议,Mininet 也可以模拟一个完整的网络主机、链接和交换机在同一台计算机上且有助于互动开发、测试和演示,尤其是那些使用 OpenFlow
2018-01-03 16:26:39 1199
原创 配置安卓SDK
下载Android SDK国内下载地址:http://www.androiddevtools.cn/配置镜像源http://mirrors.neusoft.edu.cn/more.we#android 配置步骤 启动 Android SDK Manager ,打开主界面,依次选择「Tools」、「Options…」,弹出『Android SDK Manager - Settings』窗口; 在
2018-01-03 10:26:39 1427
VC中使用的OpenGL库(glut.h)
2016-09-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人