自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 nutch单步爬虫遇到的问题

看你的nutch怎么来的,如果你只是单步爬虫,直接解压的nutch-bin.tar.gz的话,在执行crawl的时候,修改的是nutch/conf/nutch-site.xml中的agent的value值,注意:官网建议不要修改nutch-default.xml,是将其中http.agent.name属性copy到nutch-site.xml当中,这样site.xml会覆盖default.xml,所以是修改nutch-site.xml。保证solr正常启动。

2023-11-25 19:22:57 31

原创 使用ant编译Nutch源码过程中出现的问题

问题场景:因为要使用分布式爬虫,需要用到deploy文件夹,对于直接解压二进制nutch,是没有deploy文件夹的,所以需要解压nutch-src.tar.gz,然后使用ant自己编译,本篇的问题就是出现在ant编译过程中。###就是在修改ivy源的时候修改成https,如果是root用户的话。我也说了只是可能,反正我是编译成功了。##一直BUILD FAILED。#安装nutch出现的问题。

2023-11-25 18:50:56 34

原创 cf738.A

题意:https://codeforces.com/contest/1559/problem/A(反正全是英文)我对题意的偏见:大概是这么个意思,就是首先有t组测试数据,每组测试数据长度是n,然后输入数据,在输入的这组测试数据中,你可以任意挑选一个区间,定义为[l, r],然后将al+i,用al+i&ar-i替换,就是将你规定的区间范围内的所有数据都根据上面的公式加上位运算替换掉,题目的要求就在于你要将输入的数据中根据题目给定操作最小化数据中的最大值,最终输出执行操作后的数据中的最小值。(语文很烂

2021-08-16 13:20:02 120

原创 cf.737.B题

题意自查(主要是英文);我的思路:

2021-08-13 11:32:43 66

原创 字符串语法

1.char s[1000] = {"…"}; fgets(s,1000000,stdin) .(格式化输出)2.string s; getline(cin , s);3. char s[100]; cin.getline(s,10000);以上字符串的输出都是遇到空格 回车等停止时的输入方法,就是输入是把你输入的空格一并输出,否则遇到空格就停止输出了。4. puts(s); 输出(包括换行)5. 头文件 #include(cstring)6. strlen(s) 求长度

2020-11-07 17:12:08 235

原创 计算机 进制数转换 及 原码反码补码

1.二进制数转换成十进制数:指数形式(2 的一次幂 二次幂等)相加 或者 先取四位数 四位数 转换成十六进制数 再将十六进制数 (乘以16的一次幂 二次幂等).2.小数部分跟整数部分相同 位数不够时补上0.3.求负数时 先求正数 在进行取反 加1.4.十进制数转换成二进制数 用短除法 然后逆序排列 得到只有0 和 1 的二进制数.5.正小数转换成二进制数:例如 0.25 一.0.25 * 2 = 0.5 取整数部分 0.5 * 2 = 1.0 取1 直到乘到小数部分为0

2020-11-05 12:27:25 447

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除