dala_da的博客

天下事有难易乎,为之,则难者亦易矣;不为,则易者亦难矣

BeautifulSoup的使用

今天写爬虫的时候,发现使用正则表达式抓取人物装备和词缀的时候,太麻烦了然后注意到有beautifsoup模块,用的会比较方便明天周四继续熟悉一下它的用法,顺便更新本篇博客...

2018-03-07 23:03:19

阅读数:232

评论数:0

爬虫尝试抓取动态网页

之前写过一篇使用爬虫抓取暗黑3玩家数据,由于凯恩之角数据总是不更新,那个爬虫意义不大其实官方网站也是可以看到玩家数据的,我当时没有去爬的原因是...网页源代码和网页展示的数据不一样,知道最近我才知道那是动态网页百度了半天,感觉有一种方式比较简单,就是F12使用开发者工具,去找到加载网页的时候发送的...

2018-03-06 21:02:05

阅读数:672

评论数:0

多线程爬虫——抓取代理ip

在之前的blog:使用爬虫刷csdn博客访问量中,我所使用的10个ip地址都是事先填写好的,总不能每次使用都去西刺搞10个ip贴上去吧。。。于是就试着抓了一下,发现每个ip因为都要去检验好不好用,很耽误时间。正好最近在学习多线程爬虫,试着写了一下,开辟了四个线程,速度快了很多过程中,遇到了些比较棘...

2018-03-04 21:37:35

阅读数:2090

评论数:4

KMP算法的个人理解

网上关于KMP算法的详解很多,也有很多人力争做到简洁解释。我就写写我的心得理解吧,很短,应该很易懂首先来看一个反例:总串 : a b c a b c a b d e f g子串 : a b c a b d总串前5位是abcab,和子串前5位相同,但比较第6位时,不一样。这时我们错误的想一下,抛弃掉...

2018-03-01 13:59:01

阅读数:320

评论数:0

使用爬虫刷csdn博客访问量

这一篇ip为我提前设定的,自动抓取代理ip可以看我另一篇blog:多线程爬虫——抓取代理ip首先了解一下常见反爬虫的检测方法频率监测:有些网站会设置一种频率监测的机制,对于同一IP,若在一定时间内访问的速度超过了设置的阈值,那么便会判定该IP的源头是一个爬虫机器人,从而限制访问频率或暂时禁止IP对...

2018-02-28 16:42:44

阅读数:20730

评论数:7

廖雪峰Python 2.X 教程

Python简介Python是著名的“龟叔”Guido van Rossum在1989年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言。当你用一种语言开始作真正的软件开发时,你除了编写代码外,还需要很多基本的已经写好的现成的东西,来帮助你加快开发进度。比如说,要编写一个电子邮件客户端,如果先...

2018-02-27 12:30:21

阅读数:2269

评论数:0

数据结构——弗洛伊德算法

复习一下Floyd算法,代码实现很简单,3个for循环,每一层循环的意思需要深刻的理解推荐这片博客:http://blog.csdn.net/qq_34374664/article/details/52261672 有该算法的详细解释(2017.3.1)我下面的代码有很明显的缺点,所有的改动都是在...

2018-02-25 21:40:41

阅读数:654

评论数:0

PyQt输出中文出现乱码解决方法

中文乱码问题困扰了我很久,这次尝试使用PyQt最费我时间的便是汉字的转码问题,所以想写一些关于这方面问题的总结,至少以后在遇到这类问题能少走一些弯路,也希望能够帮助和我一样的萌新们,如有纰漏,欢迎大佬指点!!!首先,decode和encode的作用:decode是将其他编码的字符串转换成unico...

2018-02-23 20:28:18

阅读数:1110

评论数:0

基于PyQt的暗黑3玩家资料抓取小软件

代码主要是在上一篇blog:爬虫抓取暗黑3玩家数据中,这一篇使用PyQt设计界面,之前接触过Qt,所以上手不算难。而过程中我遇到的最棘手的问题是unicode、utf-8和Qstring之间的转换,我觉得有必要去开一篇blog写写总结界面不好看、、、界面不好看、、、界面不好看、、、我凯恩之角的数据...

2018-02-22 18:47:24

阅读数:94

评论数:0

爬虫抓取暗黑3玩家数据

这是上一篇blog:爬虫抓取暗黑3国服天梯榜数据及分析这一篇主要是抓取某一玩家角色的所有面板属性,平时在游戏中,通过天(ke)梯(long)榜只能看到大佬门的装备与技能,别人的详细面板属性是看不到的,无法直观的比较差距。不过!!!凯恩之角最近同步英雄数据的功能好像不好使、、、置顶帖的方法我等了一天...

2018-02-20 23:35:36

阅读数:143

评论数:0

爬虫抓取暗黑3国服天梯榜数据及分析

从一月末入坑,到今天19号,20多天的时间,托春节三天双倍的福,我成功的成为了900级的萌新不过买完198,就打折98,这对本萌也太不友好了吧怀着愤怒的心情......我就又买了一份、、、和老爸一起刷刷刷这两天一直关注凯恩之角,不得不说,D3的数据帝是真滴多、、、就像这两天才知道,攻速还有档位一说...

2018-02-19 20:38:14

阅读数:598

评论数:0

数据结构——Prim算法

看了一下表,刚刚过了12点,今天就是年三十了,刚看完辽视春晚,大晚上睡不着,就把白天复习的Prim给更一下。我只计算了最小生成树的权值和,没有记录出生成图各边情况,其实我代码中,Edge数组存放的是某未被访问节点(i)到已被访问的所有节点中最近的距离,可以改一下,定义一个结构体,里面放有起点,终点...

2018-02-15 00:46:07

阅读数:418

评论数:0

数据结构——迪杰斯特拉算法

这一篇写一下Dijkstra算法。当初学习数据结构的课件找不到了,就在网上找了两张图片,有一个有权无向图以及迪杰斯特拉算法的原理思想。以下是C++实现代码:#include<iostream> #include<limits.h&a...

2018-02-14 19:44:35

阅读数:310

评论数:0

堆内存与栈内存

今天翻看昨天编写的代码,突然发现上一篇:http://blog.csdn.net/dala_da/article/details/79314107中会有内存泄漏的风险。比如说我58行和90行,分别开辟了一段指定长度的空间存放bool型变量,但是函数结束前,并没有把他们删除掉、、、貌似经常犯这个错误...

2018-02-12 21:17:43

阅读数:50

评论数:0

数据结构——图的深度/广度优先遍历

这是上一篇:图的存储方式——邻接矩阵http://blog.csdn.net/dala_da/article/details/79302329从整体来看,我个人认为深度优先有点类似二叉树先序遍历,都是将访问节点压入到栈,然后看是否有延伸节点,若没有则出栈,返回到上一节点;而广度优先则与二叉树层次遍...

2018-02-12 00:28:51

阅读数:4033

评论数:0

数据结构——图的邻接矩阵存储

根据百度百科定义:一般用一个一维数组存放图中所有顶点数据;用一个二维数组存放顶点间关系(边或弧)的数据,这个二维数组称为邻接矩阵。用邻接矩阵表示图,很容易确定图中任意两个顶点是否有边相连。邻接矩阵分为有向图邻接矩阵和无向图邻接矩阵。对无向图(无向简单图)而言,邻接矩阵一定是对称的,而且对角线一定为...

2018-02-09 22:40:31

阅读数:243

评论数:0

数据结构——二叉树(2)

2018-02-08 22:54:30

阅读数:60

评论数:0

计算机网络——网络层

2018-02-07 22:38:37

阅读数:56

评论数:0

数据结构——01背包问题

2018-02-07 22:20:47

阅读数:111

评论数:0

数据结构——二叉树的递归/非递归遍历

复习一下二叉树递归非递归的先中后序遍历 写非递归后序遍历的时候卡壳了,参考了一下网上的思路,大概有两种,一种是标记每个节点是否有走过,如果父节点的左右子节点都标记访问过,则可以访问父节点;一种是定义一个指针,指向上一个访问的节点,如果某父节点的右子节点为NULL或者是上一个访问的节点,则该父节点...

2018-02-02 00:02:00

阅读数:87

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭