- 博客(8)
- 问答 (2)
- 收藏
- 关注
原创 爬虫--网络数据采集
用一周的时间翻完了python网络数据采集,在此整理一下。0x000数据采集数据采集是一个很宽泛的概念,总的来说应该包含以下部分。 选择采集目标源–>组织构建数据库–>编写爬虫–>数据清洗–>数据整理–>存入数据库,一般情况下选择目标源和构建数据库是其中的主要元素。目标源决定你收集到数据的可用性,爬虫决定你的计划是否可达。0x001目标源选择个人感觉目标源选取应按照以下条目进行排序:数据相关性 、
2017-10-25 20:19:05 6629
原创 CSP 2017-03
难道只能水前三题嘛QAQ… 随便写了一下前三题 1A 第四题写了一个基本的Dijkstra算法 不知道什么地方写错了 构造了一点样例也没有测出来 等我刷完水题再回来返工吧 mark一下1.#include<stdio.h>int main(){ int number; int count_number,count; int n,k; while(~scanf("
2017-10-20 21:25:27 462
原创 CSP 2017-09
0-0个人感觉这次题目后两道有点偏难..并没有找到合适的方法..最后一道没有尝试线段树 但估计也会TLE C语言感觉写起来好慢啊.. 比起c++很多东西都要自己写(一定是我太弱了..100#include<stdio.h>int main(){ int N; int count; while(~scanf("%d",&N)){ count = 0;
2017-10-17 09:09:20 533
原创 Python 文件处理
通用换行符转换: open的第二个参数设置成’rU’,指定通用符转化。yield 返回一个生成器 迭代器协议:对象要next方法,迭代中的下一项,要么就引起一个StopIteration异常,以终止迭代 迭代器:支持迭代器协议的对象,文件,数组,etc..生成器:提供了延迟操作,即当你想要的时候再输出结果 生成器函数:使用yield语句而非return,yield一次
2017-10-08 15:34:01 260
原创 python文本处理
杂货文本处理的三种操作: 1.解析数据并将数据放入程序内部的结构中 2.将数据以某种方式转换为另一种相似的形式,数据本身发生了改变 3.生成全新的数据python类型检查方法:鸭子判断法 如果他走路像鸭子,叫声也像鸭子,那么对于我们的应用而言,就可以认为他是鸭子了。python检错方式被称为事后原谅法(EAFP) try/exceptpython字符串拼接 python中字符串对象是无法改
2017-09-27 20:04:40 1157
原创 最长递增子序列的思索
这是一个比较古老的算法问题,在上学期的算法课中也有所讲解,不过当初并没有理解到位,现在重新思考一下。最长递增子序列问题:给定一个序列{a0,…,ai},找出其中最长的一个序列{b0,…,bj},并且满足对任意的 0 最朴素的一种解法是从a0开始,对给定序列进行遍历,在遇到分叉时产生分支,最后将最长的序列更新出来。遍历到an时便得到最大的递增序列。这种做法较为简单,但是不可取,因为对每一个ai
2017-06-02 17:37:08 215
空空如也
自旋锁引起的死锁是否算仅涉及一个进程的死锁。
2017-06-04
Java中semaphore,lock,synchronized的效率问题
2017-06-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人