wamg潇潇-CSDN博客

原创利用pycharm 快速 clone GitHub开源项目的方法

使用pycharm ——> VCS——> Checkout/ get form version control 从GitHub上克隆项目时，加速clone的方法：# 只需要将 'www.github.com/代码库' 改为 'www.github.com.cnpmjs.org/代码库'# 就可以实现一键式加速。 eg.我复制的项目地址是 https://github.com/abisee/cnn-dailymail.git 修改后的URL： https:...

2020-06-22 18:03:06 2592 2

原创一份简短又全面的数学建模技能图谱：常用模型&算法总结

本文总结了常用的数学模型方法和它们的主要用途，主要包括数学和统计上的建模方法，关于在数学建模中也挺常用的机器学习算法暂时不作补充，以后有时间就补。至于究竟哪个模型更好，需要用数据来验证，还有求解方法也不唯一，比如指派问题，你可以用线性规划OR动态规划OR整数规划OR图与网络方法来解。总的来说，常用主成分分析来降维，综合评价的方法有因子分析法、层次分析法、....，用蒙特卡罗方法来随机模拟求解；...

2020-06-15 22:43:19 204350 65

原创 win电脑C/D盘清理技巧

电脑的C盘和D盘经常提示内存不足，C盘存了太多无用的文件却又不敢乱删。通过清除缓存、分析这两个盘的大文件看看有哪些是可以删除的，哪些是文件太大但不能删的就挪到别的盘。这是我总结的一些技巧和经验，希望对大家有帮助。

2023-02-28 11:26:26 6993 1

原创 win10安装vue-devtools 、Node.js、 npm和 yarn 总结

安装NODE.JS npm 和 cnpm 进入网站 http://nodejs.cn/download/ 下载稳定版的x64的msi文件，双击安装Node.js到D:\ProgramData\nodejs 目录下，安装时选择 Add To PATH , 安装完成后finish. win +R 打开打开CMD ，输入 echo %PATH% 检查npm的本地仓库 C:\Users\Administrator\AppData\Roaming\npm 和安装目录 D:\Program...

2021-04-20 22:20:25 1108 1

原创 python 报错汇总【持续更新中....】

1.Variableencoder/embedding_encoder already exists, disallowed.总结：由于跑的翻译模型需要构建两个embed,一直报这个错误：解决方式：先在main函数调用模型之前，加上tf.reset_default_graph()tf.reset_default_graph() # 避免 Variable ./encoder/kernel already exists, disallowed.model = Seq2...

2020-10-26 17:56:47 1804

转载基于win10 和python3.6激活虚拟环境成功！

试了很多种方法，比如下面这种virtualenv envname # 创建名为envname的虚拟环境source bin/activate # 老是报错：source不是内部或外部命令后面参考了这种方法在Windows命令行中运行以下命令以激活虚拟环境先在HillarDjangoREST文件夹下，创建名为01的虚拟环境； python -m ven...

2020-09-29 09:09:34 1253 2

转载 python 安装第三方库报错 -— 需要Visual C++ 14.0 compiler 及以上

python 安装第三方库报错：error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools": https://visualstudio.microsoft.com/visual-cpp-build-tools/拯救方式：1. 根据版本对应， vc++14.0 对应的是Visual Studio 2015(可下载VS2015安装集成开发环境，好像对我没有用..

2020-09-09 11:33:17 20986 2

原创 win10 安装CUDA 11.0后再安装GPU版torch的踩坑记录

电脑先安装的cuda11.0 ，随便搜索下 cuda download,就会给您跳转到这个页面：https://developer.nvidia.com/cuda-downloads?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal然后根据网上的教程；（为避免报错，不安装visual studio integration；）Win10自定义的CUDA、cuDN...

2020-09-04 16:07:10 30471 21

原创读取keras保存的h5文件，显示各层的权重

# hdf5的数据结构主要是File - Group - Dataset三级，# 数据集dataset, 是同一类型数据的多维数组; 组group, 是一种容器结构# 参考我们的文件系统,不同的文件存放在不同的目录下:# 目录就是group,描述了数据集DataSet的分类信息,通过group有效的将多种dataset进行管理和划分# 文件就是dataset,表示具体的数据测试文件下载： blstm_model.h5 和 best_model.weights 链接..

2020-06-02 15:59:35 3856 15

原创 python3打开文本文件- FileNotFoundError: [Errno 2] No such file or directory:

在Linux或者OS X中，使用绝对路径打开文件的时候应该使用单斜杠/，(如C:/test.txt)。在Windows中，建议使用双反斜杠(如C:\\test.txt)。建议使用绝对路径；路径过长：可以先查看当前工作路径； print('当前工作路径', os.getcwd()) # main.py路径： # D:\ProgramFiles\Projects\PyCharm_Projects\514-517\BiLSTM-Classifier\bin>再用os.p...

2020-05-21 18:17:14 11254

翻译深网中的信息收集 deep web

1. 深网&表网介绍图源网站Google，Bing和其他引擎使用蜘蛛机器人来爬网并索引内容，无法抓取到数据的原因：1）无法到达：eg.需要登录的商业数据库 ,2)机器人只能读取html，机器人无法读取内容有图片、电影、没有元数据的pdf文件或其他非html内容。保守的最佳猜测是90％的Internet是Deep Web，而占10％的表网Surface We...

2020-05-06 18:16:39 4114

原创信息检索的应用 & 如何检索

目录1. 综合搜索引擎2. 特定搜索引擎信息检索在日常生活中的广泛应用1. 防止上当受骗2.健康3. 特价旅游信息4.免费读书5. 名校课程、开放教育资源OERs搜索引擎SE的分类1. 按内容的组织方式2. 按收录资源的范围3.按信息采集的方式4.按搜索引擎SE的功能5. 按面向成人/孩子6. 综合性搜索引擎的使用1. ...

2020-05-05 18:26:34 7404

原创信息检索的基本方法：构造检索式

目录1. 布尔逻辑检索2.邻近检索、位置限制3. 短语检索、精确检索：加双引号4. 截词检索 Truncation Wildcat5. 字段限制检索field limiting6. 区分大小写检索case sensitive综合：积木型检索式构造1. 布尔逻辑检索优先级： NOT- AND - OR2.邻近检索、位置限制3. ...

2020-05-05 17:58:33 14635

原创信息检索在学术领域的应用

参考：信息检索-慕课，2014，武汉大学，黄如花老师信息素养【 information literacy；】：ability of seek，find and decipher info;信息/情报/资讯检索： information retrieval ，从信息集合中找出所需信息如何利用信息检索提高工作效率图书、期刊/报纸论文、专利、标准、学位论文、会议论文网盘...

2020-05-05 17:51:01 1096

原创学术论文检索--搜索引擎篇

深网搜索引擎目录学术论文的深网搜索方法多重搜索引擎 /元搜索引擎聚类分析引擎专用的深网引擎综合搜索引擎文件和元数据的检索（暂无）查人和背景调查在线书籍在线报纸档案在线有声读物Audio Books Online影片Videos商业的深网引擎消费购物引擎Consumer Engines经济和工作搜索引擎金融政府搜索引擎国际搜索...

2020-05-05 15:06:27 4688

原创本体建模学习笔记

目录1. 语义网 & 语义网络1.1 链接数据与知识图谱的区别1.2本体构建的两种方式1.3知识图谱数据的来源0. RDF、OWL 与RDFS0.1 RDF序列化0.2 关系/ 属性0.2.1数据属性、对象属性0.2.2 描述属性特征的词汇0.2.3 本体映射词汇（Ontology Mapping）0.3 区分概念和对象2. ...

2020-04-23 20:53:38 5875 2

原创 leetcode 每日刷题记录：easy 题【2】

面试题58 - II. 左旋转字符串字符串的左旋转操作是把字符串前面的若干个字符转移到字符串的尾部。请定义一个函数实现字符串左旋转操作的功能。比如，输入字符串"abcdefg"和数字2，该函数将返回左旋转两位得到的结果"cdefgab"。我的解法：class Solution: def reverseLeftWords(self, s: str, n: int) -...

2020-04-16 20:26:52 496

原创 leetcode 每日刷题记录：easy 题

1. 整数反转题目描述：给出一个 32 位的有符号整数，你需要将这个整数中每位上的数字进行反转。见力扣：整数反转输入：123 -123 120输出： 321 -321 21我的解法：代码不够简洁，没有考虑数字的范围def reverse(x: int) -> int: st = [a...

2020-04-03 22:47:49 1339

原创导入模块、标准库time、random生成随机验证码

导入模块py（文件）出错时，可追加路径；导入包相当于执行这个包下的__init__.py文件。from . import 包名 # 从当前路径导入import sys,osprint(sys.path)x=os.path.dirname(os.path.dirname(os.path.abspath(__file__)))sys.path.append(x...

2020-03-30 18:22:53 332

原创 python获取键盘输入：对n行数据求和

1. 通过键盘获取n行数据并求和def sum_input(): # 通过键盘输入n行数字，把它转为list再求和 import sys print("请输入数字的行数：") n = int(sys.stdin.readline().strip()) # 4 print("请输入 {0} 行数字，每行的数字用空格分开，各行的用Enter分...

2020-03-27 17:02:48 3725

转载解决nltk download(‘punkt‘) 连接尝试失败

punkt 的迅雷下载链接：https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/packages/tokenizers/punkt.zip punkt 下载之后解压到本地的nltk_data 文件夹下；逐个查找哪个是系统会查找的文件夹。比如我的 C:\Users\****\AppData\Roami...

2020-03-27 17:01:09 9037 1

转载 python print \033[ 设置字符串的颜色

目录\033[3开头的是字体颜色； [1m 比 [0m 更亮更粗\033 [4开头的是背景色\033[3开头的是字体颜色； [1m 比 [0m 更亮更粗print("\033[0m你好麽，\033[1m我很好。。")print("\033[30;1m你好麽，\033[31;1m我很好。。")print("\033[32;1m你好麽，\033[1m我很好...

2020-03-22 14:52:10 10453 3

原创关于torch中permute和Transpose 的一点理解

目录Tensor.permute（d0,d1,d2,d2)torch.Transpose(Tensor, a,b)参考PyTorch 高维矩阵转置 Transpose 和 Permute ；这里只讲了，其它相关的函数可参考：【1】一文掌握torch.squeeze() 和torch.unsqueeze()的用法【2】pytorch中x = x.view(x.size(...

2020-03-19 14:16:58 3817 1

转载 win10安装wget

参考wget for windows 下载与安装先去wget下载地址下载，根据操作系统是32/64位，选择 zip或exe格式的下载；或者用这个迅雷下载链接https://nchc.dl.sourceforge.net/project/gnuwin32/wget/1.11.4-1/wget-1.11.4-1-setup.exe 下载再一路安装下去；我把它安装到 D:\Pr...

2020-03-18 17:29:40 2847 1

转载成功解决运行pycharm.exe无反应的问题！

参考pycharm双击无响应(打不开问题解决办法)1.打开C:\Windows\System32 ；以管理员身份运行cmd.exe；2.在打开的cmd窗口中，输入netsh winsock reset，按回车键；3.重启电脑；4..重启后，双击pycharm图标就能打开了！...

2020-03-16 14:12:08 7770 1

原创算法笔记（三）：递归复杂度的计算、主定理、渐进符号

有些同学可能会很困惑：时间复杂度的表示怎么一会儿是大O, 一会儿是(读作Omega)，一会儿又是（读作Theta）？这三个符号略有区别，要用数学语言才能描述，略显枯燥，我们到后面再聊大O、、表示时间复杂度的区别，大家先记住，大O、（Omega）、(Theta)都是表示时间复杂度的3种渐进符号；总的来说，大O是小于等于，是大于等于；是等于。目录大O、、表示时间复杂度的区别...

2019-11-21 21:53:39 2917 1

原创算法笔记（二）：数组

目录为什么数组要从 0 开始编号，而不是从 1 开始呢？数组是如何实现根据下标随机访问数组元素？数组和链表的区别？插入操作删除操作数组是最基础、最简单的数据结构。数组用一块连续的内存空间，来存储相同类型的一组数据，最大的特点就是支持随机访问，但插入、删除操作也因此变得比较低效，平均情况时间复杂度为 O(n)。平时业务开发可以直接使用编程语言提供的容器类，但特别底层...

2019-11-17 21:49:59 305

原创算法笔记（一）：复杂度分析：最好、最坏、平均、均摊

数据结构指的是“一组数据的存储结构”，算法指的是“操作数据的一组方法”。数据结构是为算法服务的，算法是要作用再特定的数据结构上的。效率和资源消耗的度量衡--复杂度分析。数据结构和算法解决是“如何让计算机更快时间、更省空间的解决问题”，因此需从执行时间和占用空间两个维度来评估数据结构和算法的性能。分别用时间复杂度和空间复杂度两个概念来描述性能问题，二者统称为复杂度。不管...

2019-11-17 16:25:14 4379

转载 python3 将中文句子中汉字数字金额（大小写）转阿拉伯数字

要求：把汉语句子【“处罚结果”、“违法依据”、“处罚依据”的】中的汉字（大小写）数字金额转为阿拉伯数字，如：罚款2000元，罚款俩千元整，罚款人民币两千元；步骤：先识别出文字中的数字（中文/其他格式），再统一为阿拉伯数字表示（尤其是罚款，便于后续的金额比较）；# 注意：不能识别“百分之”#把汉语句子中的汉字（大小写）数字转为阿拉伯数字，不能识别“百分之”...

2019-10-21 10:41:50 2380 3

原创 word操作

目录常用的WIN快捷键WORD初识键盘快捷键：文档内容的选取word的本质是个压缩包模板下载&模板路径WORD选项格式刷限制编辑字体段落查找 /替换通配符的查找&替换插入绘图工具分节符颜色英文的审阅布局&表格页眉和页脚最近写论文常要求页眉【奇偶页不同】页码从正文...

2019-10-18 09:19:54 1225

原创强化学习【三】：动态规划问题

·目录Policy Evaluation（策略评估）Iterative Policy Evaluation （迭代策略估计）例子：方格游戏策略迭代 policy iteration策略改进 Policy ImprovementModiﬁed Policy Iteration广义的策略迭代值迭代 Value Iteration同步DP: Synchronous...

2019-09-30 16:38:14 3381 5

原创强化学习(三）：马尔可夫决策过程MDP【下篇】

目录马尔可夫决策过程MDP： a Markov reward process with decisions策略值函数Bellman 期望公式Bellman期望公式的矩阵形式最优值函数 Optimal Value Function最优策略 Bellman最优方程Optimality EquationMDPs 的扩展Ergodic Markov P...

2019-09-29 11:49:26 2169 1

原创 keras快速入门：一个完整的机器学习流程

目录简单示例数据获取数据预处理序列填充Sequence PaddingOne-Hot Encoding：常用于类别标签的转换模型结构序列模型 Sequential ModelMultilayer Perceptron (MLP)二分类 Binary Classification多分类回归卷积网络Convolutional Neural Netwo...

2019-08-18 22:19:46 1592 1

原创算法图解：总结篇

要计算两点的距离，可使用毕达哥拉斯公式。这种距离指出了两组数字之间的相似程度。在实际工作中，经常使用余弦相似度（cosinesimilarity）。OCR指的是光学字符识别（optical character recognition）,Google使用OCR来实现图书数字化。OCR是如何工作的呢?一般而言，OCR算法提取线段、点和曲线等特征。二分查找仅在数组有序时才管用。...

2019-08-18 19:50:01 420 1

原创算法图解：动态规划求解背包问题、最长公共子串、最长公共子序列

目录背包问题练习最长公共子串最长公共子序列练习背包问题问题描述：假设你是个小偷，背着一个可装4磅东西的背包。你可盗窃的商品有如下3件。为了让盗窃的商品价值最高，你该选择哪些商品？商品名称重量（磅）价值（美元）音响 4 3000 笔记本电脑 3 2000 吉他 1 1500 每个动态规划...

2019-08-18 15:10:52 1580 1

原创贪婪算法

贪婪算法很简单：每步都采取最优的做法。【贪婪算法每步都寻找局部最优解，企图以这种方式获得全局最优解。】贪婪算法并非在任何情况下都行之有效，但它易于实现！对于NP完全问题，还没有找到快速解决方案。面临NP完全问题时，在获得精确解需要的时间太长时，可使用近似算法（approximation algorithm）。判断近似算法优劣的标准如下：速度有多快；得到的近似解与最优解的接...

2019-08-17 18:13:03 1512

原创广度优先搜索（breadth-first search，BFS）

广度优先搜索让你能够找出两样东西之间的最短距离。在广度优先搜索的执行过程中，搜索范围从起点开始逐渐向外延伸，即先检查一度关系，再检查二度关系。一度关系在二度关系之前加入查找名单。广度优先搜索不仅查找从A到B的路径，而只有按添加顺序查找时找到的是最短的路径。用队列（queue）这种数据结构来实现。类似于栈，不能随机地访问队列中的元素。队列只支持两种操作：入队和出队。队列是一种先进先出（F...

2019-08-17 17:28:50 691

原创 Python3中的sys.argv

首先需要import sys，sys是python3的一个标准库 / 模块；「argv」是「argument variable」参数变量的简写形式；是一个List列表。argv[0] 一般是被调用的脚本文件名或全路径，和操作系统有关。 sys.argv[0]表示代码本身文件路径，所以参数从1开始：argv[1]及之后是传入的数据。下面这个例子中，我们先编写一个run_cnn...

2019-08-16 10:42:52 1424 4

原创 python的yield函数

# 生成器函数def fibo(n): # 普通函数 a, b = (0, 1) for _ in range(n): a, b = b, a + b return adef fibo1(n): # 生成器函数保留上次计算的值不会重复计算 a, b = (0, 1) for _ in range(n): ...

2019-08-09 15:41:59 1128

原创 nltk.stem 词干提取（stemming）

Stemming 可以抽取词的词干或词根形式，NLTK中提供了三种最常用的词干提取器接口'''基于Porter词干提取算法'''from nltk.stem.porter import PorterStemmerporter_stemmer = PorterStemmer()porter_stemmer.stem(‘multiply’) # u’multipli’...

2019-08-07 17:18:32 9026

空空如也

空空如也