自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Algorithmguy的专栏

专注数据挖掘、自然语言处理与机器学习

  • 博客(61)
  • 资源 (1)
  • 收藏
  • 关注

原创 latex、pytorch小问题

小问题记录

2023-03-11 16:09:55 334

原创 Scene-Graph-Benchmark.pytorch(KaihuaTang)代码配置过程记录

GitHub地址:https://github.com/KaihuaTang/Scene-Graph-Benchmark.pytorch我的配置:原服务器中已经装了:cuda10.1和cuda9.0,但是想要配置cuda11.0。因此,第一步是在服务器上安装cuda11.0.参照:https://zhuanlan.zhihu.com/p/122286055第二步:根据https://github.com/KaihuaTang/Scene-Graph-Benchmark.pytorch/blob/m

2021-12-20 21:42:48 2088

转载 任务型对话系统(一)

任务型对话系统公式建模&&实例说明#任务型对话的框架图:SLU:把自然语言转换成机器可以处理的领域(domain)/意图(intention) 和槽植对(slot-value pairs),他的输入是代表用户输入Utterance的Xn,输出是Un。Xn就是用户说的话,一般是几个到几十个词。Un=(In, Zn), In是intention,Zn是槽植对。In=f(Xn...

2019-08-13 18:19:34 3522

转载 MongoDB启动异常 报错 及 正确的关闭方法

报错1:[ftdc] Unclean full-time diagnostic data capture shutdown detected, found interim file, some metrics may have been lost.解决办法:1、删除掉diagnostic数据:rm -f /var/lib/mongo/diagnostic.data/*2、启动...

2018-08-23 11:14:38 17898 1

转载 vim进入编辑模式、vim命令模式、vim实践

十八、vim进入编辑模式、vim命令模式、vim实践一、vim进入编辑模式编辑模式:一般模式下不可以修改某个字符,若要修改字符,只能进入编辑模式。从一般模式进编辑模式,只需按i、I、a、A、o、O、r和R中某个键即可。当进入编辑模式时,在屏幕尾部会显示INSERT或REPLACE字样(若你的centos支持中文,则会显示“插入”)。从编辑模式回到一般模式,按esc即可。i:在当前字符前...

2018-08-22 08:58:53 41097

原创 mongodb基础知识

指定数据存储路径 dbpath=/data/db 指定日志存储路径 logpath=/data/logs/mongodb.log 配置文件中的必要参数 /usr/mongodb/bin/mongod –dbpath /data/db –port 27017 –logpath /data/logs –logappend开启和终止mongdbsystemctl start mongo...

2018-08-22 08:56:58 316

原创 Linux下输入某些命令时会提示:bash:command not found。

问题:Linux下输入某些命令时会提示:bash:command not found。解决方案:首先,查看$PATH中是否包含了这些命令。$PATH:决定了shell到哪些目录中去寻找命令或程序,PATH值是一系列的目录。当运行程序时,linux到这些目录下搜索进行编译链接。格式:PATH = $PATH::::…:可以将自己指定的路径加到PATH中,中间用冒号”:...

2018-08-22 08:51:31 6521

原创 Linux基础知识

Linux 是一个可以实现多用户登陆的操作系统,比如“李雷”和“韩梅梅”都可以同时登陆同一台主机,他们共享一些主机的资源,但他们也分别有自己的用户空间,用于存放各自的文件。但实际上他们的文件都是放在同一个物理磁盘上的甚至同一个逻辑分区或者目录里,但是由于 Linux 的 用户管理 和 权限机制,不同用户不可以轻易地查看、修改彼此的文件。输出的第一列表示打开当前伪终端的用户的用户名(要查看当前登...

2018-08-22 00:23:49 1451

原创 centos7下使用mongo-express/adminMongo通过WEB管理MongoDB(可视化)

1.介绍MongoDB已经是最常用的NoSQL数据库,不用多说。mongo-express是一个MongoDB的Admin Web管理界面,使用NodeJS、Express、Bootstrap3编写而成。目前mongo-express应该是Github上Star最多的MongoDB admin管理界面。adminMongo也是MongoDB的Admin Web管理界面,使用NodeJS...

2018-08-21 11:55:59 3574

原创 Windows10运行VMware Workstation出现与Device Guard不兼容导致无法运行与创建虚拟机问题

原因分析 Windows10开启Hyper-V后与VMware Workstation冲突导致无法运行和新建虚拟机。一般来说Windows10默认不会打开Hyper-V,但是安装Docker默认会打开Hyper-V。解决方法 禁用Hyper-V具体见如下链接 https://blog.minirplus.com/10268/...

2018-04-19 17:03:19 2969

原创 win10\64位\python3.6下安装scrapy

win10\64位\python3.6下安装scrapy直接使用指令pip3 install scrapy,发现有诸多错误。 Failed building wheel for lxml Failed building twisted解决办法在http://www.lfd.uci.edu/~gohlke/pythonlibs/有很多用于windows的编译好的 Python第三方...

2018-04-09 20:24:50 606

转载 Git简单入门

作者:王煜仁链接:http://www.jianshu.com/p/67e6ae57595e來源:简书Git是一个开源的分布式版本控制系统,可以有效、高速的处理从很小到非常大的项目版本管理,所以在近年来,备受各大企业的青睐。它的便捷高效性为多数开发者提供便利。废话不多说,开始学习怎么在win下使用git指令将本地仓库提交到远程仓库。1、准备工作      下载Git管理工具:git下载,关

2017-11-09 21:03:13 397

原创 Two Sum

Given an array of integers, return indices of the two numbers such that they add up to a specific target.You may assume that each input would have exactly one solution, and you may not use the sam

2017-06-22 15:47:54 366

原创 LeetCode-Median of Two Sorted Arrays

原题There are two sorted arrays nums1 and nums2 of size m and n respectively.Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).Example 1:

2017-06-22 14:58:33 413

转载 神经网络浅讲:从神经元到深度学习

转自:http://www.cnblogs.com/subconscious/p/5058741.html#first神经网络浅讲:从神经元到深度学习  神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向--深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助你理解深度学习技术。  本文以一种简单的,循序的方式讲解神经网

2017-06-19 11:10:20 484

转载 深度学习新星:GAN的基本原理、应用和走向

转载自:http://www.leiphone.com/news/201701/Kq6FvnjgbKK8Lh8N.htmlGAN是“生成对抗网络”(Generative Adversarial Networks)的简称,由2014年还在蒙特利尔读博士的Ian Goodfellow引入深度学习领域。2016年,GAN热潮席卷AI领域顶级会议,从ICLR到NIPS,大量高质量论文被发表和探

2017-06-19 00:57:47 1522

原创 Randy Pausch's Last Lecture

Randy Pausch's lectureIf you lead your life the right way.The karma will take care of itself.The dream will come for you.Some advice in the lecture are as followings:1.be good at something:it ma

2017-06-09 17:05:43 945

原创 Python中遇到IndentationError

由于TAB键和空格混搭使用了。【解决如下:】http://www.crifan.com/python_syntax_error_indentationerror/#comments

2017-06-07 23:27:45 779

原创 map/reduce

1. {'a':1,'b':2}[s]是一个字典取值的写法。{'a':1,'b':2}是一个字典。[s]是key,类似于索引。此处正确取值方法是。>>{'a':1,'b':2}['a']>>1在你的例子中a b应被1 2代替。注意不要漏掉引号。这一步做到了字符串类型向整数型的转变。2.MapReduce这两个函数在你的例子中的功能我尽量表述简单。Map:接受了两个参数。

2017-06-07 23:06:33 480

原创 爬虫开发工程师实习面试——中科乐创——深圳

简单的自我介绍之后,面试官提出了以下面试问题:1.迭代器与生成器的区别?2.Char与vchar的区别?3.对xpath的了解?4.平常使用爬虫有使用什么框架吗?5.try....catch....exception...finally的用法,如果在try在有return,即捕捉到了异常,那么同时finally中也有return,那么执行逻辑是怎样的?6.对异常处理的了解?

2017-05-24 16:59:08 2547

转载 Python面试题目

原文链接-https://github.com/taizilongxu/interview_pythonPython语言特性1 Python的函数参数传递2 Python中的元类(metaclass)3 @staticmethod和@classmethod4 类变量和实例变量5 Python自省6 字典推导式7 Python中单下划线和双下划线8 字符串格式化:%和.for

2017-05-23 18:17:15 1580

转载 爬虫基础理论篇

http://www.csdn.net/article/2015-11-13/2826205关于爬虫内容的分享,我会分成两篇,六个部分来分享,分别是:我们的目的是什么内容从何而来了解网络请求一些常见的限制方式尝试解决问题的思路效率问题的取舍一、我们的目的是什么一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值,内容一般分为

2017-05-23 17:50:25 482

转载 Eclipse和PyDev搭建完美Python开发环境(Windows篇)

为什么不用别的IDE呢? IDLE是小打小闹用的,那个WingIDE是要钱的,而且用不惯。Eclipse+PyDev插件是最主流的Python开发环境了。   1.准备工作: 下载32位的JDK6 Java的开发包  我也不想装这玩意儿,但是Eclipse依赖他,没办法。下载32位的Eclipse(注1) 下载Python 2.x(注2) 2.安

2017-04-08 08:23:28 940

原创 python——爬虫

2017-04-07 21:29:04 424

原创 Python——基础总结

1、list[]可变  append()2、tuple()指向不可变 len()3、dict{}键值对,key不可变  get()4、set([])以list的形式赋值,元素不可重复而且无序  add(),remove()5、python函数返回多值其实就是返回一个tuple,多个变量可以同时接收一个tuple,按位置赋值给对应的值3**4就是3的四次方6、编写函数 impor

2017-04-07 20:24:22 433

原创 python——多重表达式

多层表达式for循环可以嵌套,因此,在列表生成式中,也可以用多层 for 循环来生成列表。对于字符串 'ABC' 和 '123',可以使用两层循环,生成全排列:>>> [m + n for m in 'ABC' for n in '123']['A1', 'A2', 'A3', 'B1', 'B2', 'B3', 'C1', 'C2', 'C3']翻译成循环代码就像下面这样:

2017-04-07 20:18:49 1714

原创 Python——条件过滤

条件过滤列表生成式的 for 循环后面还可以加上 if 判断。例如:>>> [x * x for x in range(1, 11)][1, 4, 9, 16, 25, 36, 49, 64, 81, 100]如果我们只想要偶数的平方,不改动 range()的情况下,可以加上 if 来筛选:>>> [x * x for x in range(1, 11) if x % 2 =

2017-04-07 20:13:15 709

原创 python——复杂表达式

复杂表达式使用for循环的迭代不仅可以迭代普通的list,还可以迭代dict。假设有如下的dict:d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }完全可以通过一个复杂的列表生成式把它变成一个 HTML 表格:tds = ['%s%s' % (name, score) for name, score in d.iteritems()]p

2017-04-07 20:05:33 1084

转载 Python之修改元素

Python之添加新元素现在,班里有3名同学:>>> L = ['Adam', 'Lisa', 'Bart']今天,班里转来一名新同学 Paul,如何把新同学添加到现有的 list 中呢?第一个办法是用 list 的 append() 方法,把新同学追加到 list 的末尾:>>> L = ['Adam', 'Lisa', 'Bart']>>> L.a

2017-03-31 11:17:22 1308

转载 Python之倒序访问list

Python之倒序访问list我们还是用一个list按分数从高到低表示出班里的3个同学:>>> L = ['Adam', 'Lisa', 'Bart']这时,老师说,请分数最低的同学站出来。要写代码完成这个任务,我们可以先数一数这个 list,发现它包含3个元素,因此,最后一个元素的索引是2:>>> print L[2]Bart有没有更简单的方法?

2017-03-31 11:16:41 2135

转载 Python中布尔类型

Python中布尔类型我们已经了解了Python支持布尔类型的数据,布尔类型只有True和False两种值,但是布尔类型有以下几种运算:与运算:只有两个布尔值都为 True 时,计算结果才为 True。True and True # ==> TrueTrue and False # ==> FalseFalse and True # ==> False

2017-03-31 10:41:07 927

转载 Python中整数和浮点数

Python中整数和浮点数Python支持对整数和浮点数直接进行四则混合运算,运算规则和数学上的四则运算规则完全一致。基本的运算:1 + 2 + 3 # ==> 64 * 5 - 6 # ==> 147.5 / 8 + 2.1 # ==> 3.0375使用括号可以提升优先级,这和数学运算完全一致,注意只能使用小括号,但是括号可以嵌套很多层:(

2017-03-31 10:35:15 4139 1

原创 Python中Unicode字符串

Python中Unicode字符串字符串还有一个编码问题。因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),0 - 255被用来表示大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如

2017-03-31 10:31:07 443

原创 Python中raw字符串与多行字符串

Python中raw字符串与多行字符串如果一个字符串包含很多需要转义的字符,对每一个字符都进行转义会很麻烦。为了避免这种情况,我们可以在字符串前面加个前缀r ,表示这是一个 raw 字符串,里面的字符就不需要转义了。例如:r'\(~_~)/ \(~_~)/'但是r'...'表示法不能表示多行字符串,也不能表示包含'和 "的字符串(为什么?)如果要表示多行字符串,

2017-03-31 10:05:10 475

原创 python——基础2

Python中什么是变量在Python中,变量的概念基本上和初中代数的方程变量是一致的。例如,对于方程式 y=x*x ,x就是变量。当x=2时,计算结果是4,当x=5时,计算结果是25。只是在计算机程序中,变量不仅可以是数字,还可以是任意数据类型。在Python程序中,变量是用一个变量名表示,变量名必须是大小写英文、数字和下划线(_)的组合,且不能用数字开头

2017-03-30 21:41:56 331

原创 python——基础1

Python之print语句print语句可以向屏幕上输出指定的文字。比如输出'hello, world',用代码实现如下:>>> print 'hello, world'注意:1.当我们在Python交互式环境下编写代码时,>>>是Python解释器的提示符,不是代码的一部分。2.当我们在文本编辑器中编写代码时,千万不要自己添加 >>>。pri

2017-03-30 21:31:27 327

原创 数据挖掘——基本概念

1、定义:对于数据挖掘我们可以从两个角度来定义它:a. 技术定义:数据挖掘是通过对大量的数据进行分析,以发现和提取隐含在其中的具有价值的信息和知识的过程。b.商业定义: 数据挖掘是一种新的商业信息处理技术, 其主要特点是对商业数据库中的大量业务数据进行抽取、 转换、 分析和其他模型化处理, 从中提取辅助商业决策的关建化数据。2、数据挖掘的主要模型有:分类与预测,聚类和关联分析等

2017-03-29 16:59:53 9797

原创 机器学习——模型评估和选择

第二章  模型评估和选择 基本概念:1、过拟合(过配):将训练样本自身的一些特点当作了所有潜在样本都具有的一般特性,导致泛化性能下载。2、欠拟合(欠配):无法从训练样本中学习到足够量的所有潜在样本都具有的一般特性。3、误差:学习器的实际输出与样本的真实输出之间的差异称为误差。训练误差:学习器在训练集上的误差称为训练误差或经验误差。泛化误差:在新样本上的误差称为泛化误差。

2017-03-29 16:48:05 676

原创 机器学习——基本术语

第一章  基本术语定义:从数据中自动的归纳逻辑或规则,并根据这个归纳的结果与新数据来进行预测的算法。要讨论算法的相对优劣,必须要针对具体的学习问题。目标:使得学得的模型能很好的适用于“新样本”,而不仅仅在训练样本上工作得很好,即便是对聚类这样的无监督学习,也希望学得的聚划分能适用于没在训练集中出现的样本。样本(示例、特征向量): 数据集中的每个记录称之为样本或者示例。 属性空间(样

2017-03-29 16:34:17 2058

转载 KNN算法理解

一、算法概述1、kNN算法又称为k近邻分类(k-nearest neighbor classification)算法。最简单平凡的分类器也许是那种死记硬背式的分类器,记住所有的训练数据,对于新的数据则直接和训练数据匹配,如果存在相同属性的训练数据,则直接用它的分类来作为新数据的分类。这种方式有一个明显的缺点,那就是很可能无法找到完全匹配的训练记录。kNN算法则是从训练集中找

2017-02-07 09:55:05 887

PRML课后答案

模式识别与机器学习(PRML)的课后详细答案,内容清晰完整。

2018-07-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除