自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 爬取小说网站时遇到的问题

'gbk' code can't decode byte ...原因:解决:事件完整描述 原因: 文章中包含有‘gbk’或‘utf-8’无法编码的字符 解决: 一般编程语言在做decode时,都可以设置‘ignore’,设置一下即可 事件完整描述 本人想爬取小说网站的小说文本,但发现爬取结果为乱码 于是用乱码在线恢复工具测试,如下图所示 很明显,原来编码是GBK,现编码为iso-8859-1 所以需要先按ios-8859-1 encode 一下,再用GBK decode 一下, 但是decode时会出现

2020-06-01 13:22:33 569

原创 问一个关于NLP中N-gram的问题,急急急

问一个关于NLP中N-gram的问题,急急急背景说明要求是这样的我觉得难以实现的是我是这样理解的,但老师说不对 背景说明 最近是毕业季,而我的毕设题目是文本可视化分析,其中就用到了自然语言处理中的N-gram。 要求是这样的 统计每一个文本中单词的bigram出现的频率,选择了前1500个高频单词的bigram作为特征向量 我觉得难以实现的是 如何统计每一个词的bigram概率 我是这样理解的,但老师说不对 如:句子 S=“我在西安上大学” 那么“大学”的概率就是,P(“大学”|S)=1/6 即,首先把句子

2020-05-31 13:21:35 229

原创 交换机的高级配置之启发式问答

1. 简述生成树协议的原理? 答:首先选择根桥(注:交换机像是一条多端口的网桥设备),接下来,其他网桥各自选择一条“最粗壮”的树枝作为到根桥的路径,相应的端口就成了根端口,根桥和根端口都确定后一棵树就生成了。 2. 交换机链路聚合和链路冗余有什么区别? 答:冗余链路使路径选择有了更多的方案,但STP生成树协议发挥作用时,这些冗余链路便无法利用了,但使用聚合链路便可重新利用这些冗余链路。(答非...

2018-12-12 22:30:17 184

原创 交换机及其基本配置-启发式问答

1. 简述交换机的工作方式 答:当交换机收到一个数据帧时,先在MAC地址表中检查源MAC地址,如果没有则把它记录在MAC地址表中;在检查目的MAC地址,如果有转发或丢弃(目的地址与源地址相同时丢弃),如果没有则广播到所有端口 2.简述VLAN及IEEE 802.1Q协议结构 答:(1)VLAN(Virtual Local Area Network),既虚拟局域网,在交换式以太网中,可以利用V...

2018-12-12 18:32:36 312

原创 字符输入输出和输入确认

字符输入输出和输入确认 本章着重说明: 1. 有关输入、输出以及缓冲和非缓冲输入之间的区别的更多内容 2. 从键盘模拟文件结尾的方法 3. 如何重定向您的程序与文件向连接 4. 使用户界面更加友好 在计算机世界中,我们在很多场合下都是用输入(input)和输出(output)。例如,再讲输入和输出设备(如键盘、磁盘驱动器和激光打印机等)时 ...

2018-11-22 17:27:47 303

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除