自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 只要开始,永远不晚——技术记录

大学四年并没有写过博客,各种课程、课程设计、学习过程都没有好好记录,但是很庆幸我自己选择了考研,从现在开始要加油了。

2020-03-05 18:34:04 58 0

原创 Python爬虫实践(二) -- 爬虫进阶与数据库
原力计划

在前一篇博客中描述要求的基础上,将用户的所有信息爬取下来,并按约束与数据类型存入关系型数据库。 Python爬虫实践(一) -- 社交网站用户信息爬取 使用Scrapy

2020-07-01 22:37:32 124 0

原创 MySQL创建新连接时,不能成功连接的问题

创建新连接后,用户名和密码都是对的,地址和端口也都是本地但还是会出现错误。比如: 1、2003错误:2003 cannot connect to mysql 一般是没有启动MySQL服务,在服务中找到MySQL80,启动之。 2、1045错误:ERROR 1045 (28000): Acce...

2020-07-01 21:10:47 33 0

原创 Python实现 -- K最短路径算法

实现在一张图中寻找K条最短路径(较短路径)以及代码测试过程中学习到的Python基础知识。

2020-06-15 15:11:30 79 0

原创 C、C++实现 -- 字符串分割函数split

最近做毕设用惯了Java,突然一个学弟找我问了道题,我发现C++没有split这个函数,还是挺麻烦的,于是找了找博客和思路。 #include <vector> #include <string> #include <iostream> using name...

2020-06-04 19:08:10 30 0

原创 将SpringBoot项目打包并部署到云端 -- jar、war、tomcat

maven命令: 屏蔽test、clean、package pom文件: <!--打包成jar的话--> <modelVersion>4.0.0</modelVersion> <groupId>com.demo</groupId>...

2020-05-27 17:00:41 61 0

原创 SpringBoot项目引入前端模板时,CSS、JS、HTML文件无法加载的问题

做的问答系统的界面不够美观,虽然尽力改了,但还是没有很好看很主流。 于是找了个H+的模板来改。 改完之后,放到项目里运行,结果并没有如期显示。 F12查看,是CSS与JS文件没有找到。 在pom文件加了些默认项: <build> <resources> ...

2020-05-23 15:35:05 64 0

原创 计算机考研复试准备 -- 专业基础知识
原力计划

目录 初试笔记 算法与数据结构基础 密码学和安全基础 机器学习相关课程 参考文章 报考中科院信工所国重。 初试笔记 过一遍重点知识 括号匹配 表达式求值,中后缀转化 递归改非递归 对称矩阵,哈希表 循环队列满和空 树的遍历、前序、中序、后序 图的遍历、DFS与动态规划 最小生成树...

2020-05-19 14:56:49 2433 1

原创 SpringBoot在前端发送url时,不能识别特殊字符的问题

由于Tomcat的新版本中增加了一个新特性,就是严格按照 RFC 3986规范进行访问解析,而 RFC 3986规范定义了Url中只允许包含英文字母(a-zA-Z)、数字(0-9)、-_.~4个特殊字符以及所有保留字符(RFC3986中指定了以下字符为保留字符:! * ’ ( ) ; : @ &a...

2020-05-08 21:04:53 81 0

原创 SpringBoot日志的相关知识

开发环境为IntelliJ IDEA 2020.1 (Ultimate Edition) 想让后台的Spark日志info关闭 了解到日志级别有TRACE < DEBUG < INFO < WARN < ERROR < FATAL ,且级别是逐渐提供,如果日志级别...

2020-04-28 16:29:32 30 0

原创 Anaconda使用conda连接网络时,出现网络错误CondaHTTPError

今天准备安一个Anaconda来管理我的Python环境,在官网下载支持Python3.7的版本。 conda --version #查看版本,是否安装成功 conda upgrade --all #更新包,查看是否网络有问题 在使用conda连接网络更新包的版本时,出现网络...

2020-04-23 12:59:30 362 0

原创 Python转换图片格式 -- PIL库的使用

PIL库提供了强大的功能,可以将所有格式的彩色或灰度图片读入,并以其他格式保存(真格式,而不是重命名)。 对于彩色图像,不管其图像格式是PNG,还是BMP,或者JPG,在PIL中,使用Image模块的open()函数打开后,返回的图像对象的模式都是“RGB”。 对于灰度图像,不管其图像格式是P...

2020-04-20 21:48:50 57 0

原创 使用HanLP分词时,词性标注错误的问题

使用HanLP分词时,标注词性经常出错,尤其见于人名译名的错误。 比如将“海尔”识别为人名,标注了nrf词性。 但是我们想把“海尔”识别为品牌名字,就需要修改nrf.txt文件。 修改词典后要删除对应的二进制文件,如nrf.txt.trie.dat文件。 重新Build项目,Run。 ...

2020-04-09 19:19:45 132 0

原创 Python爬虫实践(一) -- 社交网站用户信息爬取

给一个FB的用户ID,爬这个用户的所有内容: 比如发帖情况、帖子转发情况,被谁赞,赞的人的名字,评价评论,他的朋友,他的个人信息。 过程原理分析 原理:并不用fq,只是理论层次的...

2020-04-09 17:20:26 171 0

原创 离散数学基础知识

集合论成了数学各分支的基础,也是计算机科学非常重要的基础知识。它的起源可追溯到16世纪末,主要是对数集进行了卓有成效的研究。但集合论实际发展是由19世纪70年代德国数学家康托(G. Cantor)在无穷序列和分析的有关课题的理论研究中创立的。康托对具有任意特性的无穷集合进入了深入的探讨,提出了关于...

2020-04-06 16:58:11 276 0

原创 Python文件中,reload(sys)找不到的问题

Python2中的代码: import sys reload(sys) sys.setdefaultencoding(‘utf-8’) Python3中的代码: import importlib,sys importlib.reload(sys)

2020-04-03 19:47:16 95 0

原创 读取文件时,文本文件的UTF-8格式带来的问题

用记事本程序打开文本文件的UTF-8格式,文本保存时会包含BOM。 BOM,Byte Order Mark,字节顺序标记,出现在文本文件头部,Unicode编码标准中用于标识文件是采用哪种格式的编码。 在编程时读取文件时,会在文件的开头出现 \ufeff 或 \UFEFF 。 可以通...

2020-04-01 14:32:45 51 0

原创 基于京东家电商品知识图谱的自动问答系统(三) -- Java实现问答系统

基于知识图谱的自动问答系统架构 问答步骤: 1、拿到原始句子(问题),将其分词 2、对原句子进行抽象,将单词用对应的词性替换并抽象句子。比如 “海尔...

2020-03-31 21:32:49 239 0

原创 中文语句分词 -- HanLP词性

HanLP官方定义词性标注集 1 Are a 形容词 ad 副形词 ag 形容词性语素 al 形容词性惯用语 an 名形词 b 区别词 begin bg 区别语素 bl 区别词性惯用语 c 连词 cc 并列连词 d 副词 dg 辄,俱,复之类的副词 dl 连语 e 叹词 end 仅用于终##终 ...

2020-03-31 21:15:44 166 4

原创 Maven项目中,jar包版本冲突导致运行时报错的问题

在开发的过程中,我们难免会遇到各种jar包冲突,解决了就可以解决大部分的问题。 maven工程,一个artifact的jar包可能不只一处被依赖;有时候依赖会出现相同的artifact却不同版本,相互存在冲突,这时就需要exclude某个版本。 IntelliJ IDEA,该如何找某个arti...

2020-03-24 13:58:24 144 0

原创 Windows上的Spark环境搭建后,运行时报错的问题

搭建好环境后,命令行没有问题,测试HanLP的时候没错,但是在测试贝叶斯分类的时候报错: java.lang.NoSuchMethodError: org.apache.spark.util.Utils$.getSimpleName(Ljava/lang/Class;)Ljava/lang/S...

2020-03-24 11:51:27 35 0

原创 使用Python的pip方法安装第三方包时,很慢或者失败的问题

Python可以在命令行中很方便地进行某个包的安装,比如: pip install openpyxl #管理员命令行输入,安装openpyxl包 或者更新某个包: pip install --upgrade openpyxl #更新openpyxl包 或者更新pip这个程序: ...

2020-03-23 13:20:47 119 0

原创 在IDEA中进行开发时,Maven的插件或依赖显示红线的问题

如果maven的插件显示红线,其实这并不影响运行,但是还是很闹心对吧。 可以在maven设置中找到maven库的位置,文件资源管理器打开路径,删除对应的文件/文件夹,再reimport。 依赖问题先检查网络,网络没问题的话可以考虑更换依赖的版本,去Maven库统计网站寻找用的最多的版本号,更换...

2020-03-23 13:09:05 73 0

原创 基于京东家电商品知识图谱的自动问答系统(二) -- IDEA搭建开发环境

在IEDA中搭建Scala、Hadoop、Spark环境 hanlp.properties文件内容: #本配置文件中的路径的根目录,根目录+其他路径=完整路径(支持相对路径,请参考:https:...

2020-03-23 12:35:42 91 0

原创 计算机密码学基础知识

一个密码系统是整个安全系统的一部分,由五部分组成(M,C,K,E,D): 1、明文空间M:全体明文的集合,明文(Plaintext):伪装前的原始数据。 2、密文空间C:全体密文的集合,密文(Ciphertext):伪装后的数据。 3、密钥空间K:全体密钥的集合,K = < Ke,Kd...

2020-03-19 23:48:48 339 0

原创 基于京东家电商品知识图谱的自动问答系统(一) -- Neo4j构建知识图谱

电脑打开京东首页,搜索冰箱、空调、电视机、洗衣机、热水器、电饭煲等常用的家用电器关键词,复制弹出的搜索结果界面的链接。 下载安装“八爪鱼”爬虫工具,这是一个通过定义规则自动生成脚本抓取数据的工具,注册免费版即可使用常用功能,也可以用教育邮箱注册一年专业版。 可以先学习官方提供的新手入门教程...

2020-03-19 12:56:19 584 2

原创 力扣题目系列:121. 买卖股票的最佳时机

给定一个数组,它的第i 个元素是一支给定股票第 i 天的价格。 如果你最多只允许完成一笔交易(即买入和卖出一支股票),设计一个算法来计算你所能获取的最大利润。 注意你不能在买入股票前卖出股票。 示例 1:输入: [7,1,5,3,6,4] 输出: 5 解释: 在第 2 天(股票价格 = 1)...

2020-03-09 23:33:48 30 0

原创 力扣题目系列:322. 零钱兑换

给定不同面额的硬币 coins 和一个总金额 amount。编写一个函数来计算可以凑成总金额所需的最少的硬币个数。如果没有任何一种硬币组合能组成总金额,返回-1。 示例1:输入: coins = [1, 2, 5], amount = 11 输出: 3 解...

2020-03-08 15:06:57 65 0

原创 力扣题目系列:1. 两数之和

给定一个整数数组 nums和一个目标值 target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。 你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。 示例:给定 nums = [2, 7, 11, 15], target = 9,因为 nums...

2020-03-08 13:34:01 73 0

原创 力扣题目系列:1313. 解压缩编码列表

给你一个以行程长度编码压缩的整数列表nums。考虑每对相邻的两个元素 freq, val] = [nums[2*i], nums[2*i+1]](其中i >= 0),每一对都表示解压后子列表中有 freq个值为val的元素,你需要从左到右连接所有子列表以生成解压后的列表。请你返回解压后的列表...

2020-03-08 13:22:26 32 0

原创 力扣题目系列:面试题57 - II. 和为s的连续正数序列

输入一个正整数 target ,输出所有和为 target 的连续正整数序列(至少含有两个数)。 序列内的数字由小到大排列,不同序列按照首个数字从小到大排列。 示例 1:输入:target = 9 输出:[[2,3,4],[4,5]] 示例 2:输入:target = 15 输出:[[1,2,...

2020-03-07 17:14:33 45 0

原创 人工智能相关基础知识

机器学习是一种实现人工智能的方法,最基本的做法是,使用算法来解析数据从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。机器学习源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶...

2020-03-06 14:46:13 634 0

原创 数据结构、算法基础知识

2-结点:含有一个键(及值)和两条链接,左链接指向的2-3树中的键都小于该结点,右链接指向的2-3树中的键都大于该结点。 3-结点:含有两个键(及值)和三条链接,左链接指向的2-3树中的键都小于该结点,中链接指向的2-3树中的键都位于该结点的两个键之间,右链接指向的2-3树中的键都大于该结点。 ...

2020-03-06 14:41:42 37 0

原创 Linux系统相关基础知识

Unix/Linux系统中,任何软硬件都被视为文件,文件是字节序列 常规/普通文件:程序代码、文本以及大多数用户创建、使用的文件。 目录:包含关于其他文件的信息(如,文件名),由一组按照操作系 统定义的特殊格式的记录所组成的,不是标准的ASCII文本文件。 设备文件:包含对应于外围设备(如打...

2020-03-06 14:40:24 46 0

原创 C++相关MFC基础知识

对于窗口程序,一般有个特点:窗口大部分的区域保持不变,只有部分区域需要重新绘制。如果将整个窗口全部刷新的话,就做了许多不必要的工作,因而,MFC采用了一套基于无效区的处理机制。对于一个单线程程序,通过一个while循环不断的刷新窗口,程序无法响应其他消息(除非使用多线程),所以使用无效区的处理机制...

2020-03-06 14:23:31 53 0

原创 网络相关AJAX基础知识

同步现象:客户端发送请求到服务器端,当服务器返回响应之前,客户端都处于等待、卡死状态; 异步现象:客户端发送请求到服务器端,无论服务器是否返回响应,客户端都可以随意做其他事情,不会被卡死。 AJAX(Asynchronous JavaScript and XML)即异步的JavaScript和...

2020-03-06 14:17:05 80 0

原创 数据库系统相关基础知识

模式(也称逻辑模式):是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图,综合了所有用户的需求。一个数据库只有一个模式。模式是数据库系统模式结构的中间层,与数据的物理存储细节和硬件环境无关,与具体的应用程序、开发工具及高级程序设计语言无关。模式的定义方式: 数据的逻辑结构(数据项的...

2020-03-06 13:32:28 90 0

原创 Spring系列框架相关基础知识

Spring的概念:Spring是一种多层的J2EE应用程序框架,其核心就是提供一种新的机制管理业务对象及其依赖关系。它是一种容器框架,用于创建bean,维护bean之间的关系,它可以管理web层,持久层,业务层等,可以配置各个层的组件并且维护各个层的关系。 在 Spring...

2020-03-05 21:57:17 121 0

原创 Java语言相关基础知识

Java语言的一个非常重要的特点就是与平台的无关性。而使用Java虚拟机是实现这一特点的关键。Java编译器只要面向JVM,生成JVM能理解的代码或字节码文件。Java源文件经编译成...

2020-03-05 21:16:07 32 0

原创 2020国科大考研经验分享 -- 初试复习和复试面试

数学一复习推荐: 可以报学校附近的实体辅导班,可以听网课(汤家凤高数,李永乐线代,王式安概率论)。 前期辅导书就买李永乐复习全书,或单独的李永乐线代讲义,王式安概率讲义。 中期刷题也可以选李永乐的660之类。 后期真题也是买李永乐那本红色的真题大全,可以模拟可以单项强化。 建议早些(早...

2020-03-05 18:37:19 192 2

提示
确定要删除当前文章?
取消 删除