自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

冷月无声的博客

You must always have faith in who you are.

原创 利用pycharm 快速 clone GitHub开源项目的方法

使用pycharm ——> VCS——> Checkout/ get form version control 从GitHub上克隆项目时,加速clone的方法:# 只需要将 'www.github.com/代码库' 改为 'www.github.com.cnpmjs.org/代码库'# 就可以实现一键式加速。 eg.我复制的项目地址是 https://github.com/abisee/cnn-dailymail.git 修改后的URL: https:...

2020-06-22 18:03:06 178 1

原创 一份简短又全面的数学建模技能图谱:常用模型&算法总结

本文总结了常用的数学模型方法和它们的主要用途,主要包括数学和统计上的建模方法,关于在数学建模中也挺常用的机器学习算法暂时不作补充,以后有时间就补。至于究竟哪个模型更好,需要用数据来验证,还有求解方法也不唯一,比如指派问题,你可以用线性规划OR动态规划OR整数规划OR图与网络方法来解。总的来说,常用主成分分析来降维,综合评价的方法有因子分析法、层次分析法、....,用蒙特卡罗方法来随机模拟求解;...

2020-06-15 22:43:19 19993 22

原创 读取keras保存的h5文件,显示各层的权重

# hdf5的数据结构主要是File - Group - Dataset三级,# 数据集dataset, 是同一类型数据的多维数组; 组group, 是一种容器结构# 参考我们的文件系统,不同的文件存放在不同的目录下:# 目录就是group,描述了数据集DataSet的分类信息,通过group有效的将多种dataset进行管理和划分# 文件就是dataset,表示具体的数据测试文件下载 : blstm_model.h5 和 best_model.weights 链接..

2020-06-02 15:59:35 468 7

原创 python3打开文本文件- FileNotFoundError: [Errno 2] No such file or directory:

在Linux或者OS X中,使用绝对路径打开文件的时候应该使用单斜杠/,(如C:/test.txt)。在Windows中,建议使用双反斜杠(如C:\\test.txt)。建议使用绝对路径;路径过长:可以 先查看当前工作路径; print('当前工作路径', os.getcwd()) # main.py路径: # D:\ProgramFiles\Projects\PyCharm_Projects\514-517\BiLSTM-Classifier\bin>再用os.p...

2020-05-21 18:17:14 226

翻译 深网中的信息收集 deep web

1. 深网&表网介绍图源网站Google,Bing和其他引擎使用蜘蛛机器人来爬网并索引内容,无法抓取到数据的原因:1)无法到达:eg.需要登录的商业数据库 ,2)机器人只能读取html,机器人无法读取内容有图片、电影、没有元数据的pdf文件或其他非html内容。 保守的最佳猜测是90%的Internet是Deep Web,而占10%的表网Surface We...

2020-05-06 18:16:39 373

原创 信息检索的应用 & 如何检索

目录1. 综合搜索引擎2. 特定搜索引擎信息检索在日常生活中的广泛应用1. 防止上当受骗2.健康3. 特价旅游信息4.免费读书5. 名校课程、开放教育资源OERs搜索引擎SE的分类1. 按内容的组织方式2. 按收录资源的范围3.按信息采集的方式4.按搜索引擎SE的功能5. 按面向成人/孩子6. 综合性搜索引擎的使用1. ...

2020-05-05 18:26:34 608

原创 信息检索的基本方法:构造检索式

目录1. 布尔逻辑检索2.邻近检索、位置限制3. 短语检索、精确检索:加双引号4. 截词检索 Truncation Wildcat5. 字段限制检索field limiting6. 区分大小写检索case sensitive综合: 积木型检索式构造1. 布尔逻辑检索优先级: NOT- AND - OR2.邻近检索、位置限制3. ...

2020-05-05 17:58:33 427

原创 信息检索在学术领域的应用

参考:信息检索-慕课,2014,武汉大学,黄如花老师信息素养【 information literacy;】:ability of seek,find and decipher info;信息/情报/资讯检索: information retrieval ,从信息集合中找出所需信息如何利用信息检索提高工作效率图书、期刊/报纸论文、专利、标准、学位论文、会议论文网盘...

2020-05-05 17:51:01 217

原创 学术论文检索--搜索引擎篇

深网搜索引擎目录学术论文的深网搜索方法多重搜索引擎 /元搜索引擎聚类分析引擎专用的深网引擎综合搜索引擎文件和元数据的检索(暂无)查人和背景调查在线书籍在线报纸档案在线有声读物Audio Books Online影片Videos商业的深网引擎消费购物引擎Consumer Engines经济和工作搜索引擎金融政府搜索引擎国际搜索...

2020-05-05 15:06:27 647

原创 本体建模学习笔记

目录1. 语义网 & 语义网络1.1 链接数据与知识图谱 的区别1.2本体构建的两种方式1.3知识图谱数据的来源0. RDF、OWL 与RDFS0.1 RDF序列化0.2 关系/ 属性0.2.1数据属性、对象属性0.2.2 描述属性特征的词汇0.2.3 本体映射词汇(Ontology Mapping)0.3 区分概念和对象2. ...

2020-04-23 20:53:38 387

原创 leetcode 每日刷题记录:easy 题【2】
原力计划

面试题58 - II. 左旋转字符串字符串的左旋转操作是把字符串前面的若干个字符转移到字符串的尾部。请定义一个函数实现字符串左旋转操作的功能。比如,输入字符串"abcdefg"和数字2,该函数将返回左旋转两位得到的结果"cdefgab"。我的解法:class Solution: def reverseLeftWords(self, s: str, n: int) -...

2020-04-16 20:26:52 82

原创 leetcode 每日刷题记录:easy 题
原力计划

1. 整数反转题目描述: 给出一个 32 位的有符号整数,你需要将这个整数中每位上的数字进行反转。见 力扣:整数反转输入:123 -123 120输出: 321 -321 21我的解法:代码不够简洁,没有考虑数字的范围def reverse(x: int) -> int: st = [a...

2020-04-03 22:47:49 115

原创 导入模块 、标准库time、random生成随机验证码

导入模块py(文件)出错时,可追加路径;导入包相当于执行这个包下的__init__.py文件。from . import 包名 # 从当前路径导入import sys,osprint(sys.path)x=os.path.dirname(os.path.dirname(os.path.abspath(__file__)))sys.path.append(x...

2020-03-30 18:22:53 102

原创 python获取 键盘输入:对n行数据求和

1. 通过键盘获取n行数据并求和def sum_input(): # 通过键盘输入n行数字,把它转为list再求和 import sys print("请输入数字的行数:") n = int(sys.stdin.readline().strip()) # 4 print("请输入 {0} 行数字,每行的数字用空格分开,各行的用Enter分...

2020-03-27 17:02:48 390

转载 解决nltk download('punkt') 连接尝试失败

punkt 的迅雷下载 链接:https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/packages/tokenizers/punkt.zip punkt 下载之后解压到本地的nltk_data 文件夹下;逐个查找 哪个是系统会查找的文件夹。比如我的 C:\Users\****\AppData\Roami...

2020-03-27 17:01:09 1414

转载 python print \033[ 设置字符串的颜色

目录\033[3开头的是字体颜色 ; [1m 比 [0m 更亮更粗\033 [4开头的是背景色\033[3开头的是字体颜色 ; [1m 比 [0m 更亮更粗print("\033[0m你好麽,\033[1m我很好。。")print("\033[30;1m你好麽,\033[31;1m我很好。。")print("\033[32;1m你好麽,\033[1m我很好...

2020-03-22 14:52:10 625 1

原创 关于torch中permute和Transpose 的一点理解

目录Tensor.permute(d0,d1,d2,d2)torch.Transpose(Tensor, a,b)参考PyTorch 高维矩阵转置 Transpose 和 Permute ;这里只讲了 ,其它相关的函数可参考:【1】一文掌握torch.squeeze() 和torch.unsqueeze()的用法【2】pytorch中x = x.view(x.size(...

2020-03-19 14:16:58 335

转载 win10安装wget

参考wget for windows 下载与安装先去wget下载地址下载,根据操作系统 是32/64位,选择 zip或exe格式的下载;或者用 这个迅雷下载链接https://nchc.dl.sourceforge.net/project/gnuwin32/wget/1.11.4-1/wget-1.11.4-1-setup.exe 下载再一路安装下去;我把它安装到 D:\Pr...

2020-03-18 17:29:40 243

转载 成功解决运行pycharm.exe无反应的问题!

参考pycharm双击无响应(打不开问题解决办法)1.打开C:\Windows\System32 ; 以管理员身份运行cmd.exe;2.在打开的cmd窗口中,输入netsh winsock reset,按回车键;3.重启电脑;4..重启后,双击pycharm图标就能打开了!...

2020-03-16 14:12:08 1173

原创 算法笔记(三):递归复杂度的计算、主定理、渐进符号

有些同学可能会很困惑:时间复杂度的表示怎么一会儿是 大O, 一会儿是(读作Omega),一会儿又是(读作Theta)?这三个符号略有区别,要用数学语言才能描述,略显枯燥,我们到后面再聊大O、、表示时间复杂度的区别,大家先记住,大O、(Omega)、(Theta)都是表示时间复杂度的3种渐进符号;总的来说 ,大O是小于等于, 是大于等于;是等于。目录大O、、表示时间复杂度的区别...

2019-11-21 21:53:39 148

原创 算法笔记(二):数组

目录为什么数组要从 0 开始编号,而不是从 1 开始呢?数组是如何实现根据下标随机访问数组元素?数组和链表的区别?插入操作删除操作数组是最基础、最简单的数据结构。 数组用一块连续的内存空间,来存储相同类型的一组数据,最大的特点就是支持随机访问,但插入、删除操作也因此变得比较低效,平均情况时间复杂度为 O(n)。 平时业务开发可以直接使用编程语言提供的容器类,但特别底层...

2019-11-17 21:49:59 90

原创 算法笔记(一):复杂度分析:最好、最坏、平均、均摊

数据结构指的是“一组数据的存储结构”, 算法指的是“操作数据的一组方法”。 数据结构是为算法服务的,算法是要作用再特定的数据结构上的。效率和资源消耗的度量衡--复杂度分析。 数据结构和算法解决是“如何让计算机更快时间、更省空间的解决问题”,因此需从执行时间和占用空间两个维度来评估数据结构和算法的性能。分别用时间复杂度和空间复杂度两个概念来描述性能问题,二者统称为复杂度。不管...

2019-11-17 16:25:14 252

转载 python3 将中文句子中汉字数字金额(大小写)转阿拉伯数字

要求:把汉语句子【“处罚结果”、“违法依据”、“处罚依据”的】中的汉字(大小写)数字金额转为阿拉伯数字,如: 罚款2000元,罚款俩千元整,罚款人民币两千元;步骤: 先识别出文字中的数字(中文/其他格式), 再统一为阿拉伯数字表示(尤其是罚款,便于后续的金额比较);# 注意:不能识别“百分之”#把汉语句子中的汉字(大小写)数字转为阿拉伯数字,不能识别“百分之”...

2019-10-21 10:41:50 541 2

原创 word操作

目录常用的WIN快捷键WORD初识键盘快捷键:文档内容的选取word的本质是个压缩包模板下载&模板路径WORD选项格式刷限制编辑字体段落查找 /替换通配符的查找&替换 插入绘图工具分节符颜色英文的审阅布局&表格页眉和页脚 最近写论文常要求页眉【奇偶页不同】页码从正文...

2019-10-18 09:19:54 166

原创 强化学习【三】:动态规划问题

·目录Policy Evaluation(策略评估)Iterative Policy Evaluation (迭代策略估计)例子:方格游戏策略迭代 policy iteration策略改进 Policy ImprovementModified Policy Iteration广义的策略迭代值迭代 Value Iteration同步DP: Synchronous...

2019-09-30 16:38:14 466 5

原创 强化学习(三):马尔可夫决策过程MDP【下篇】

目录马尔可夫决策过程MDP: a Markov reward process with decisions策略值函数Bellman 期望公式Bellman期望公式 的矩阵形式最优值函数 Optimal Value Function最优策略 Bellman最优方程Optimality EquationMDPs 的扩展Ergodic Markov P...

2019-09-29 11:49:26 465

原创 keras快速入门:一个完整的机器学习流程

目录简单示例数据获取数据预处理序列填充Sequence PaddingOne-Hot Encoding: 常用于类别标签的转换模型结构序列模型 Sequential ModelMultilayer Perceptron (MLP)二分类 Binary Classification多分类回归卷积网络Convolutional Neural Netwo...

2019-08-18 22:19:46 707 1

原创 算法图解:总结篇

要计算两点的距离,可使用毕达哥拉斯公式。这种距离指出了两组数字之间的相似程度。在实际工作中,经常使用余弦相似度(cosinesimilarity)。OCR指的是光学字符识别(optical character recognition),Google使用OCR来实现图书数字化。OCR是如何工作的呢?一般而言,OCR算法提取线段、点和曲线等特征。二分查找仅在数组有序时才管用。...

2019-08-18 19:50:01 88 1

原创 算法图解: 动态规划求解背包问题、最长公共子串、最长公共子序列

目录背包问题练习最长公共子串最长公共子序列练习背包问题问题描述:假设你是个小偷,背着一个可装4磅东西的背包。你可盗窃的商品有如下3件。为了让盗窃的商品价值最高,你该选择哪些商品?商品名称 重量(磅) 价值(美元) 音响 4 3000 笔记本电脑 3 2000 吉他 1 1500 每个动态规划...

2019-08-18 15:10:52 622 1

原创 贪婪算法

贪婪算法很简单:每步都采取最优的做法。【贪婪算法每步都寻找局部最优解,企图以这种方式获得全局最优解。】 贪婪算法并非在任何情况下都行之有效,但它易于实现! 对于NP完全问题,还没有找到快速解决方案。面临NP完全问题时,在获得精确解需要的时间太长时,可使用近似算法(approximation algorithm)。 判断近似算法优劣的标准如下:速度有多快;得到的近似解与最优解的接...

2019-08-17 18:13:03 198

原创 广度优先搜索(breadth-first search,BFS)

广度优先搜索让你能够找出两样东西之间的最短距离。在广度优先搜索的执行过程中,搜索范围从起点开始逐渐向外延伸,即先检查一度关系,再检查二度关系。一度关系在二度关系之前加入查找名单。广度优先搜索不仅查找从A到B的路径,而只有按添加顺序查找时找到的是最短的路径。用队列(queue)这种数据结构来实现。类似于栈,不能随机地访问队列中的元素。队列只支持两种操作:入队和出队。队列是一种先进先出(F...

2019-08-17 17:28:50 161

原创 Python3中的sys.argv

首先需要import sys,sys是python3的一个标准库 / 模块;「argv」是「argument variable」参数变量的简写形式;是一个List列表。argv[0] 一般是被调用的脚本文件名或全路径,和操作系统有关。 sys.argv[0]表示代码本身文件路径,所以参数从1开始:argv[1]及之后是传入的数据。下面这个例子中,我们先编写一个run_cnn...

2019-08-16 10:42:52 375 2

原创 python的yield函数

# 生成器函数def fibo(n): # 普通函数 a, b = (0, 1) for _ in range(n): a, b = b, a + b return adef fibo1(n): # 生成器函数 保留上次计算的值 不会重复计算 a, b = (0, 1) for _ in range(n): ...

2019-08-09 15:41:59 74

原创 nltk.stem 词干提取(stemming)

Stemming 可以抽取词的词干或词根形式,NLTK中提供了三种最常用的词干提取器接口'''基于Porter词干提取算法'''from nltk.stem.porter import PorterStemmerporter_stemmer = PorterStemmer()porter_stemmer.stem(‘multiply’) # u’multipli’...

2019-08-07 17:18:32 1445

转载 python 将二维list转为一维

参考这里'''两种方法'''document = [[ ..],[...],[....]] # 二维数组from tkinter import _flattenprint(list(_flatten(document)))from itertools import chainlist(chain.from_iterable(document))...

2019-08-07 16:26:56 2039

转载 Python运行的17个时新手常见错误

1)忘记在 if , elif , else , for , while , class ,def 声明末尾添加 :(导致 “SyntaxError :invalid syntax”)2)使用 = 而不是 ==(导致“SyntaxError: invalid syntax”)= 是赋值操作符 == 是等于比较操作。3) 错误的使用缩进量。(导致“Indentatio...

2019-08-07 15:16:57 69

原创 python报错TypeError: must be str, not list

今天LDA话题聚类时,总是不能写入聚类结果,报错在下面绿色的这一行,TypeError: must be str, not list我试着像别人说的那样改open函数,还是报错,最后大神给出的方案成功跑通了import reimport logging # logbookfrom gensim import corpora, models, similaritiesim...

2019-08-07 10:44:13 3515

原创 'float' object has no attribute 'decode'

于python3默认是unicode编码。最近读取存储为.csv格式的文件,报属性错误,参考jieba分词时出现AttributeError: 'float' object has no attribute 'decode'的做法,在read_csv后面加上.astype(str) ,不再报错。import pandas as pdimport numpy as npimpor...

2019-08-06 09:46:29 3476 1

转载 TypeError: unhashable type: 'slice'解决方法

2019-08-05 15:10:11 3565

转载 python提示AttributeError: 'NoneType' object has no attribute 'append'

在写python脚本时遇到AttributeError: 'NoneType' object has no attribute 'append'a=[]b=[1,2,3,4]a = a.append(b) '''会报错,改为a.append(b)'''执行一次后发现a的类型变为了NoneType。下次执行时就会出现如题所示的错误。把a = a.append(b)改为a.app...

2019-08-05 15:07:06 3829

提示
确定要删除当前文章?
取消 删除