自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一个菜鸡

一个菜鸡的日常

  • 博客(8)
  • 问答 (2)
  • 收藏
  • 关注

原创 爬虫--网络数据采集

用一周的时间翻完了python网络数据采集,在此整理一下。0x000数据采集数据采集是一个很宽泛的概念,总的来说应该包含以下部分。 选择采集目标源–>组织构建数据库–>编写爬虫–>数据清洗–>数据整理–>存入数据库,一般情况下选择目标源和构建数据库是其中的主要元素。目标源决定你收集到数据的可用性,爬虫决定你的计划是否可达。0x001目标源选择个人感觉目标源选取应按照以下条目进行排序:数据相关性 、

2017-10-25 20:19:05 6629

原创 CSP 2017-03

难道只能水前三题嘛QAQ… 随便写了一下前三题 1A 第四题写了一个基本的Dijkstra算法 不知道什么地方写错了 构造了一点样例也没有测出来 等我刷完水题再回来返工吧 mark一下1.#include<stdio.h>int main(){ int number; int count_number,count; int n,k; while(~scanf("

2017-10-20 21:25:27 462

原创 CSP 2017-09

0-0个人感觉这次题目后两道有点偏难..并没有找到合适的方法..最后一道没有尝试线段树 但估计也会TLE C语言感觉写起来好慢啊.. 比起c++很多东西都要自己写(一定是我太弱了..100#include<stdio.h>int main(){ int N; int count; while(~scanf("%d",&N)){ count = 0;

2017-10-17 09:09:20 533

原创 Python 文件处理

通用换行符转换: open的第二个参数设置成’rU’,指定通用符转化。yield 返回一个生成器 迭代器协议:对象要next方法,迭代中的下一项,要么就引起一个StopIteration异常,以终止迭代 迭代器:支持迭代器协议的对象,文件,数组,etc..生成器:提供了延迟操作,即当你想要的时候再输出结果 生成器函数:使用yield语句而非return,yield一次

2017-10-08 15:34:01 260

原创 python文本处理

杂货文本处理的三种操作: 1.解析数据并将数据放入程序内部的结构中 2.将数据以某种方式转换为另一种相似的形式,数据本身发生了改变 3.生成全新的数据python类型检查方法:鸭子判断法 如果他走路像鸭子,叫声也像鸭子,那么对于我们的应用而言,就可以认为他是鸭子了。python检错方式被称为事后原谅法(EAFP) try/exceptpython字符串拼接 python中字符串对象是无法改

2017-09-27 20:04:40 1157

原创 最长递增子序列的思索

这是一个比较古老的算法问题,在上学期的算法课中也有所讲解,不过当初并没有理解到位,现在重新思考一下。最长递增子序列问题:给定一个序列{a0,…,ai},找出其中最长的一个序列{b0,…,bj},并且满足对任意的 0 最朴素的一种解法是从a0开始,对给定序列进行遍历,在遇到分叉时产生分支,最后将最长的序列更新出来。遍历到an时便得到最大的递增序列。这种做法较为简单,但是不可取,因为对每一个ai

2017-06-02 17:37:08 215

原创 HOJ 1128 Find Them

HOJ 1128 Find Them

2017-03-11 17:55:21 211

原创 HOJ 1461 Gene Shuffle

ACM水题之路

2017-03-10 22:43:32 193

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除