自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

智数与链

关注人工智能、数据分析和 区块链

  • 博客(36)
  • 收藏
  • 关注

原创 lnmp 环境开启 fileinfo php 扩展

最近在使用lmpa过程中,发现没有phpfileinfo扩展,找了不少资料,这个方法最简单lnmp 1.4 及 以下版本如果已经安装了lnmp就升级, 如果没有安装就修改配置文件 已安装: 使用vim 打开 lnmp安装包目录下的 include/upgrade_php.sh 利用vim的 替换功能 , 将 --disable-fileinfo 全部替换成空 然后再执行 ./up...

2019-04-09 14:22:01 1005

原创 【诗歌】值得背诵古诗(一)

1、唐寅《桃花庵诗》桃花坞里桃花庵(an),桃花庵下桃花仙;桃花仙人种桃树,又摘桃花卖酒钱。酒醒只在花前坐,酒醉还来花下眠;半醒半醉日复日,花落花开年复年。但愿老死花酒间,不愿鞠躬车马前;车尘马足富者趣,酒盏花枝贫者缘。若将富贵比贫者,一在平地一在天;若将贫贱比车马,他得驱驰我得闲。别人笑我忒疯癫,我笑别人看不穿;不见五陵豪杰墓,无花无酒锄作田。2、王勃...

2019-04-03 15:15:06 641

原创 【爬虫学习笔记】scrapy 工具命令

Scrapy tool 针对不同的目的提供了多个命令,每个命令支持不同的参数和选项。一、默认的Scrapy项目结构在开始对命令行工具以及子命令的探索前,让我们首先了解一下Scrapy的项目的目录结构。虽然可以被修改,但所有的Scrapy项目默认有类似于下边的文件结构:scrapy.cfgmyproject/ __init__.py items.py pi...

2019-03-22 09:08:46 198

转载 【爬虫学习】Scrapy初步涉猎

用scrapy 完成下列任务:创建一个Scrapy项目 定义提取的Item 编写爬取网站的spider并提取Item 编写Item Pipeline来存储提取到的Item(即数据)Scrapy由Python编写。如果您刚接触并且好奇这门语言的特性以及Scrapy的详情, 对于已经熟悉其他语言并且想快速学习Python的编程老手, 我们推荐Learn Python The...

2019-03-21 08:48:19 175

转载 【爬虫学习笔记】用Python抓取指定页面

我使用的编辑器是Idle, 安装好Python3后这个编辑器也安装好了, 小巧轻便, 按一个F5就能运行并显示结果. 代码如下: 1 2 3 4 5 6 7 #encoding:UTF-8 import urllib.request url = "http://www.baidu.co...

2019-03-20 08:53:42 423

原创 【爬虫】一、爬虫的基本原理

一、爬虫是干嘛的简单来说,爬虫就是获取网页并提取和保存信息的自动化程序,下面概要介绍一下。二、爬虫步骤1、 获取网页爬虫首先要做的工作就是获取网页,这里就是获取网页的源代码。源代码里包含了网页的部分有用信息,所以只要把源代码获取下来,就可以从中提取想要的信息了。前面讲了请求和响应的概念,向网站的服务器发送一个请求,返回的响应体便是网页源代码。所以,最关键的部分...

2019-03-19 15:47:38 742

原创 python 学习笔记【线程】

线程线程(thread)是进程(process)中的一个实体,一个进程至少包含一个线程。比如,对于视频播放器,显示视频用一个线程,播放音频用另一个线程。如果我们把进程看成一个容器,则线程是此容器的工作单位。进程和线程的区别主要有:进程之间是相互独立的,多进程中,同一个变量,各自有一份拷贝存在于每个进程中,但互不影响;而同一个进程的多个线程是内存共享的,所有变量都由所有线程共享; 由于...

2019-01-15 21:02:31 146

原创 机器学习数学基础【概率】

1、为什么使用概率?概率论是用于表示不确定性陈述的数学框架,即它是对事物不确定性的度量。在人工智能领域,我们主要以两种方式来使用概率论。首先,概率法则告诉我们AI系统应该如何推理,所以我们设计一些算法来计算或者近似由概率论导出的表达式。其次,我们可以用概率和统计从理论上分析我们提出的AI系统的行为。计算机科学的许多分支处理的对象都是完全确定的实体,但机器学习却大量使用概率论。实际上如果...

2019-01-13 09:49:34 507

原创 python 学习笔记【类的方法】

 1、类专有的方法一个类创建的时候,就会包含一些方法,主要有以下方法:类的专有方法:方法 说明 __init__ 构造函数,在生成对象时调用 __del__ 析构函数,释放对象时使用 __repr__ 打印,转换 __setitem__ 按照索引赋值 __getitem__ 按照索引获取值 __len__ 获得长度...

2019-01-13 09:36:13 145

原创 python 学习笔记【mysql操作数据库 二】

Python 操作数据库连接数据库,必须的。>>> import MySQLdb>>> conn = MySQLdb.connect(host="localhost",user="root",passwd="123123",db="qiwsirtest",charset="utf8")Python 建立了与数据

2019-01-12 10:43:43 263

转载 盘点那些手机上绝对值得安装的 App

       文章里面总结了一些非常良心好用的 App,堪称「神器」,我从里面优中选优,挑选了 24 款佳软(见下面这张图),好东西就要拿出来分享,所以今天就和你来介绍一下它们各自的功能特点,希望里面刚好有你需要的。这一期先介绍一半,也就是前 3 排 共12 款 App,剩下的留到下一期,可能有些你正在用或者用过,或者你有用到更好的 App,不妨留言告诉我。1. 存储空间清理先来第 1...

2019-01-12 10:13:08 2548 1

原创 常用it 小伙伴 工具网站

1.Git还在担心自己辛辛苦苦写的代码被误删了吗?还在担心自己改错了代码不能挽回吗?还在苦恼于多人开发合作找不到一个好的工具吗?那么用Git就对了,Git是一个开源的分布式版本控制系统,用以有效、高速的处理从很小到非常大的项目版本管理。有了它,代码托管不是问题,版本控制不再苦恼,多人开发变得简单易行。链接:http://git-scm.com/ 2.GitHub学会了Git之后...

2019-01-11 16:20:22 721

转载 python 代码实例【简单验证码识别】

一、探讨识别图形验证码可以说是做爬虫的必修课,涉及到计算机图形学,机器学习,机器视觉,人工智能等等高深领域……简单地说,计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。图形通常由点、线、面、体等几何元素和灰度、色彩、线型、线宽等非几何属性组成。计算机涉及到的几何图形处理一般有 2维到n维图形处理,边界区分,面积计算,体积计...

2019-01-10 13:42:52 243

原创 pytho 学习笔记【进程】

进程进程(process)是正在运行的程序的实例,但一个程序可能会产生多个进程。比如,打开 Chrome 浏览器程序,它可能会产生多个进程,主程序需要一个进程,一个网页标签需要一个进程,一个插件也需要一个进程,等等。每个进程都有自己的地址空间,内存,数据栈以及其他记录其运行状态的辅助数据,不同的进程只能使用消息队列、共享内存等进程间通讯(IPC)方法进行通信,而不能直接共享信息。for...

2019-01-10 10:21:10 122

原创 python 学习笔记 【mysql 数据库 一 】

一、安装你的电脑或许不会天生就有 MySQL(是不是有的操作系统,在安装的时候就内置了呢?的确有,所以特别推荐 Linux 的某发行版),它本质上也是一个程序,若有必要,须安装。我用 ubuntu 操作系统演示,因为我相信读者将来在真正的工程项目中,多数情况下是要操作 Linux 系统的服务器,并且,我酷爱用 ubuntu。还有,本教程的目标是 from beginner to maste...

2019-01-10 10:16:42 204

原创 机器学习 英语单词

机器学习 machine learning模型  model学习算法 learning algorithm示例:instance样本 sample属性 arribtute 特征 feature属性值 attribute value属性空间 attribute space样本空间 sample space特征向量 feature vector维数 dimensionality ...

2019-01-09 22:08:53 456

原创 python 学习 【正则表达式】

正则表达式正则表达式(regular expression)是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。比如,正则表达式 'hello' 可以匹配字符串 'hello'。要注意的是,正则表达式并不是一个程序,而是用于处理字符串的一种模式,如果你想用它来处理字符串,就必须使用支持正则表达式的工具,比如 Linux 中的 awk, sed, grep,或者编程语言 ...

2019-01-09 17:26:53 133

原创 python 学习笔记【pandas 】

一、基本数据集操作(1)读取 CSV 格式的数据集pd.DataFrame.from_csv(“csv_file”)或者:pd.read_csv(“csv_file”)(2)读取 Excel 数据集pd.read_excel("excel_file")(3)将 DataFrame 直接写入 CSV 文件如下采用逗号作为分隔符,且不带索引:df.to...

2019-01-09 09:59:31 143

原创 python 学习笔记 【file】

一、文件 file通常建议用内置函数 open() 打开文件,file 用于类型判断。>>> with open("test.txt", "w") as f:... print isinstance(f, file) // 类型判断... f.writelines(map(str, range(10)))TrueFile Object 实...

2019-01-08 16:01:18 245

转载 一文带你搭建简单的酒店推荐系统

1. 数据数据是匿名用户的,并且所有字段都是数字格式。数据可以在Kaggle中下载,train.csv中记录用户的行为,destinations.csv包含了用户的酒店信息。import datetimeimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as...

2019-01-08 10:53:56 1578

原创 python 学习笔记【模块】

不同于 C++、Java、C# namespace 仅作为符号隔离前缀,Python 模块是运行期对象。模块对应同名源码文件,为成员提供全局名字空间。一、模块对象模块对象有几个重要属性:name: 模块名 .,在 sys.modules 中以此为主键。 file: 模块完整文件名。 dict: 模块 globals 名字空间。除使用 py 文件外,还可动态创建模块对象。&g...

2019-01-08 08:01:51 680

原创 python 学习笔记【Generators】

生成器(Generators)首先我们要理解迭代器(iterators)。迭代器是一个让程序员可以遍历一个容器(特别是列表)的对象。然而,一个迭代器在遍历并读取一个容器的数据元素时,并不会执行一个迭代。换句话说这里有三个部分:可迭代对象(Iterable) 迭代器(Iterator) 迭代(Iteration) 上面这些部分互相联系。我们会先各个击破来讨论他们,然后再讨论生成器(ge...

2019-01-07 19:44:33 102

转载 深度哲学:王阳明心学精髓

    如果说,在中国有且只能评出一位哲学家,那么我认为就是王阳明。     这是因为他不仅在哲学思想上造诣极深,通达了那个彼岸世界或者称之为超感性世界,而且在人生的实践之中,将其所创立的心学运用的炉火纯青,有所向披靡之势。因此,很多无良作者把王阳明心学包装为成功学的根据,与此同时一些无脑的不学无术之辈也借此加以攻击。还有一些人,因为阳明心学极其深刻,沁入骨髓,有一旦学成能究天人之际,通古今之...

2019-01-07 13:05:18 942

原创 数学基础学习笔记:向量运算基础--向量距离

在机器学习里,我们的运算一般都是基于向量的,一条用户具有100个特征,那么他对应的就是一个100维的向量,通过计算两个用户对应向量之间的距离值大小,有时候能反映出这两个用户的相似程度。这在后面的KNN算法和K-means算法中很明显。设有两个n维变量和,则一些常用的距离公式定义如下:1、曼哈顿距离曼哈顿距离也称为城市街区距离,数学定义如下:曼哈顿距离的Python实现:f...

2019-01-07 12:32:43 1287 2

转载 机器学习的数学基础一

一、概述我们知道,机器学习的特点就是:以计算机为工具和平台,以数据为研究对象,以学习方法为中心;是概率论、线性代数、数值计算、信息论、最优化理论和计算机科学等多个领域的交叉学科。所以本文就先介绍一下机器学习涉及到的一些最常用的的数学知识。 二、线性代数2-1、标量一个标量就是一个单独的数,一般用小写的的变量名称表示。2-2、向量一个向量就是一列数,这些数是有序排列的...

2019-01-07 12:28:13 162

转载 网络安全中的机器学习算法

网络安全中的机器学习算法 相当多的文章已经描述了机器学习在网络安全的应用以及保护我们免受网络攻击的能力。尽管如此,我们仍然需要仔细研究人工智能(AI)、机器学习(ML)和深度学习(DL),它们到底能不能像炒作内容所说的无所不能。首先,我要让你失望了。我通过研究发现与图像识别或自然语言处理相比,机器学习永远不会成为网络安全的灵丹妙药,而这两个领域的机器学习应用正在蓬勃发展。因为总会有人试...

2019-01-07 12:01:49 807

原创 python 学习笔记【装饰器 】

装饰器 (Decorator) 在 Python 编程中极为常见,可轻松实现 Metadata、Proxy、 AOP 等模式。简单点说,装饰器通过返回包装对象实现间接调用,以此来插入额外逻辑。语法看上去和 Java Annotation、C# Attribute 类似,但不仅仅是添加元数据。>>> @check_args... def test(*args):... p...

2019-01-06 13:35:51 138

原创 python 学习笔记【Map 】

MapMap会将一个函数映射到一个输入列表的所有元素上。这是它的规范:规范map(function_to_apply, list_of_inputs)大多数时候,我们要把列表中所有元素一个个地传递给一个函数,并收集输出。比方说:items = [1, 2, 3, 4, 5]squared = []for i in items: squared.append(i*...

2019-01-06 13:01:02 109

转载 2019年的人工智能需要什么

2019年的人工智能需要什么      “人机对战”这样的主题总是能够吸引大众的眼光。过去的2018年,我们始终将目光放在机器“挑战”人类带来的恐慌和膜拜,但忽略了更本质的东西。当我们理解AI in All的时候,往往把范围限定在产业领域。为了解决产业领域的人工智能问题,人工智能需要一群“公民数据科学家”,他们需要了解数据科学,了解人工智能的思维方式,是出色的研究人才,而当我们将范围扩展到整个...

2019-01-05 14:33:19 23847 4

原创 tensorflow【With】学习笔记

tensorflow 学习过程中,经常用到with,值得一说。With要搭配上下文管理器(Context Manager)对象使用。所谓的上下文管理器对象,就是实现了上下文管理器协议(Context Manager Protocol)的对象。协议要求对象定义中必须实现__enter__()和__exit__()方法。当看到下面语句时:With Context Manager Ob...

2019-01-05 14:20:08 2385

原创 python学习笔记之---*args 的用法

*args 和 **kwargs 主要用于函数定义。 你可以将不定数量的参数传递给一个函数。这里的不定的意思是:预先并不知道, 函数使用者会传递多少个参数给你, 所以在这个场景下使用这两个关键字。 *args 是用来发送一个非键值对的可变数量的参数列表给一个函数.这里有个例子帮你理解这个概念:def test_var_args(f_arg, *argv): print("fi...

2019-01-05 11:47:32 549

原创 Python之虚拟环境(virtualenv)

在开发和使用过程,我们经常会遇见一些升级或者不同的配置,那很多情况下需要用到虚拟环境。一、什么是virtualenv?   Virtualenv 是一个工具,它能够帮我们创建一个独立(隔离)的Python环境。想象你有一个应用程序,依赖于版本为2的第三方模块,但另一个程序依赖的版本是3,请问你如何使用和开发这些应用程序?如果你把一切都安装到了/usr/lib/python2.7/sit...

2019-01-05 11:33:18 445

转载 TensorFlow的图

一、什么是图     TensorFlow程序通常被组织成一个构建阶段和一个执行阶段. 在构建阶段, op的执行步骤被描述成一个图. 在执行阶段, 使用会话执行执行图中的op。我们来构建一个简单的计算图。每个节点采用零个或多个张量作为输入,并产生张量作为输出。一种类型的节点是一个常数。像所有TensorFlow常数一样,它不需要任何输入,它输出一个内部存储的值。我们可以创建两个浮点型常量node...

2019-01-04 12:31:38 179

原创 对于张量有哪些增长和操作

内容来自网络,自己梳理和归纳一、张量通常是动态增长的,它的增长通常可以用三种形式来实现。第一种是维度的增长。比如我们只考虑用户时间、电影和评分来进行张量建模,那么这个张量只有三个维度。但如果我们再把电影主题也加进去,那么就从一个三维张量增长成了四维张量,这是通过维度上的增长。第二种增长是维度中数据的增长,如现在我们有用户、时间和电影这三个维度,但是还会有新的用户,也会有新的电影,时间也...

2019-01-04 12:18:28 529

原创 什么是tesorflow的张量 (tensor)?

自己通过网上查询的有关张量的解释,稍作整理。一、一般情况下:1.单个的数值叫Scalar。也就是一个数字。比如说250这样的自然数。也可以是实数。下同。2.一维的数组叫Vector,也就是向量。比如 {a1,a2,a3......an}。这里a1,a2...的值都是Scalar。3.二维的数组叫Matrix,也就是矩阵。4.三维以上的都叫Tensor,也就是张量。在tens...

2019-01-04 11:55:07 339

转载 python 安装与numpy matplotlib 等库安装

(1)下载numpy包本文安装的numpy包来自 Python extension packages 网站,numpy-1.10.4+mkl-cp34-cp34m-win_amd64.whl(现在该网站已经不提供此版本饿numpy)(2)安装numpy将下载的numpy包拷贝到D:\softwares_diy\Python34\Scripts下(不知道怎么回事只有在这个目录下 pi...

2019-01-04 08:38:34 2069

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除