自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 收藏
  • 关注

原创 机器学习——Keras

文章目录Keras基本概念Keras 的重要特性Keras 架构Keras工作流Keras的编译和训练Keras基本概念Keras —— 简洁高效的深度神经网络工具Keras 是一个python深度学习框架,可以方便定义和训练几乎所有类型的深度学习模型Keras 最开始是为研究人员 开发的,目的是为了能够快速实验Keras 的重要特性相同 的代码可以在CPU 和 GPU上无缝的切...

2019-09-02 23:41:59 898

原创 数据分析 —— numpy

什么是numpyNumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:一个强大的N维数组对象 ndarray广播功能函数整合 C/C++/Fortran 代码的工具线性代数、傅里叶变换、随机数生成等功能Num...

2019-08-26 15:39:46 257

原创 数据分析——matplotlab

1.什么是matplotlsbMatplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形 。通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。绘制折线图import randomfrom matplotlib import pyplot as plt#...

2019-08-26 13:54:39 413

原创 基于Scrapy框架影视信息采集与分析

一. Scrapy的基础知识定义Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。爬虫与scrapy通用爬虫框架:scrapy框架运行流程:scrapy 框架分为四个组成部分:Item PipelinespiderSchedulerDownloaderEngine...

2019-08-26 11:05:23 700

原创 机器学习 —— 卷积神经网络

一. 问题引入Q: 我们是怎么判断见到的一个人,是认识还是不认识?1)我们把对象的轮廓提取出来,与我们脑子里的“人脸数据库”进行对比2)如果有相似概率比较高的,我们就进行下一步处理;如果没有,这个人我们大概率就不去看了3)抽取对象的局部特征,与我们脑子里某个人的局部特征进行对比4)得出结论:(1)如果相似度接近100%,那我们断定,就是这个人(2)如果相似度较高,根据新的特征,那我们...

2019-08-19 16:51:30 381

原创 机器学习 —— 神经网络

一. 神经网络(一)基础知识定义人工神经网络(Artificial Neural Networks,简写为ANNs)也简称为神经网络(NNs)或称作连接模型(Connection Model),它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络:是一种应用类似于...

2019-08-19 15:51:52 769

原创 API及项目案例——拉钩网的数据采集

文章目录一. API二. 项目案例 —— 拉钩网数据采集(一)需求分析(二)数据解析及实验结果一. API定义API(Application Programming Interface,应用程序接口)是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。 目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问原码,或理解内部工作机制的细节。使用方法A...

2019-08-19 10:31:37 1357

原创 机器学习——支持向量机

支持向量机—— 大间距分类器逻辑回归的损失函数如果 y=1如果y=0逻辑回归的损失函数:支持向量机的损失函数:控制权衡的方式:逻辑回归: A + λBSVM: CA + B支持向量机的损失函数理解:当C很大的时候只用看theta的平方 —— 线性分类当C小的时候,不仅看theta,还要看theta的转置——非线性分类当y=1时,希望是当y=0 时,希望...

2019-08-12 14:43:43 152

原创 机器学习——决策树与随机森林

文章目录一. 决策树1. 定义2. 决策树的生成3. 损失函数4. **决策树的纯度****5. 决策树的分割方式—— 非线性****6. 剪枝**7. one-hot**7. 单棵决策树缺点****8. 代码实现决策树**二. 随机森林1. 定义2. 随机森林运行机制3. 随机森林的中心思想 —— 并行思想4. 随机森林与逻辑回归5. 代码实现随机森林一. 决策树1. 定义逻辑回归是一种线...

2019-08-12 11:40:47 1271

原创 爬虫基础

根据使用的场景可以将网络爬虫分为通用爬虫和聚焦爬虫一. 通用爬虫定义从互联网上搜集网页,采集信息,这些网页信息用于为搜索引擎建立索引从而提供支持,它决定着整个引擎系统的内容是否丰富,信息是否及时,因此其性能的优劣直接影响着搜索引擎的效果。目的是搜索引擎抓取系统的重要组成部分,主要的目的是将互联网上的网页下载到本地,形成一个互联网的镜像备份。工作基本流程先是进行信息采集...

2019-08-12 10:00:44 187

原创 机器学习---基本信息

人工智能与机器学习(一)人工智能人工智能的定义只要能让计算机模拟人类行为的技术,就称作是人工智能在我们生活中 ,有很多对未来世界的假设,有很多关于人工智能的电影2. 人工智能的分类领域1) 模式识别2) 图像识别图像识别应用的领域:自动驾驶——> 深度神经网络,图像识别,模式识别图像识别/图像处理工业自动化 ——> 机器学习/图像识别光学影像 ...

2019-08-10 00:18:13 223

原创 机器学习—— 线性回归

一. 单变量线性回归(一) 基础知识第一个机器学习算法—— 单变量线性回归回归: 突出的数据,在经过一段时间之后,总会回归到大部分数据的水平中对于一元线性回归(单变量线性回归)来说,学习算法为y = ax + b 在机器学习中,我们可表示为hθ(x) = θ0 + θ1x1模型:参数:θ0, θ1损失函数:目标: 最小化损失函数hθ (x) - 原函数Jθ (x)...

2019-08-05 17:01:23 555

原创 机器学习——KNN

一. KNN第一个用来进行分类的机器学习算法KNN 的工作原理存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入本有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取出样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,通常k是不大于2...

2019-08-05 15:17:35 139

原创 机器学习 —— NLP

NLP ——Natural Language Prrocessing 自然语言处理一. NLP 文本相似度分析马蜂窝评论造假事件马蜂窝发现很多评论是通过机器写入的造假评论那么是怎么发现的? ———— 采用NLP 的文本相似度分析文本相似度分析: 从海量的数据(文章,评论)中,把相似的数据挑选出来步骤:把评论翻译成机器能够看的懂的语言使用机器看得懂的算法轮回去比较每一...

2019-08-05 14:48:45 439

原创 jQuery

一. jQuery简介jQuery是一个函数库,是一个js 文件jQuery 是目前使用最广泛的javascript函数库。页面使用< script>标签引入这个js 文件,就就可以使用jQuery。jQuery的加载将获取的语句写到页面的头部,会因为元素没有加载出来而报错,jQuery提供了read方法解决这个问题。 <script type="text/j...

2019-08-05 11:51:08 101

原创 CSS层叠样式表

文章目录一. CSS 基本介绍定义:CSS 是指层叠样式表(Cascading Style Sheets) 是用来定义如何控制HTML 元素,从而实现美化HTML 网页优势为了让网页元素的样式更加丰富,也为了让网页内容和样式能够拆分,CSS 由此思想而产生。 有了CSS , HTML 大部分的表现样式的标签都可以不用了,因此,HTML 只负责文档的结构和内容,表现形式完全交给CSS ,...

2019-08-05 11:04:01 338

原创 HTML

文章目录一. web前端介绍web 开发技术可以分为: 客户端开发技术和服务端开发技术

2019-07-29 12:02:51 125

原创 网络编程练习

1. 简述 OSI 七层协议。1) 物理层: 建立、维护、断开物理连接。(由底层网络定义协议)2) 数据链路层3) 网络层4) 传输层 主要的协议有 : TCP / UDP协议5) 会话层 : 建立、管理、终止会话6) 表示层7) 应用层: 是网络服务与最终用户的一个接口。2. 简述TCP/IP四层协议。1) 主机连接到网络层。2) 网络互连层: 网络互连层定义了分组格式和...

2019-07-24 15:16:01 518

原创 网络编程

文章目录一. 网络通信概述二. TCP/IP 协议(一)基本定义(二)IP地址(三)子网掩码(四) 端口三. Socket 编程(一) 基本概念(二) UDP(三) TCP总结一. 网络通信概述网络: 网络是一种辅助双方或者多方可以连接在一起的工具使用网络的目的:1) 用网络能将多方连接在一起,然后进行数据传递2) 网络编程就是让在不同的电脑上的软件能够进行数据传递,即进程间的通信...

2019-07-24 11:17:33 242

原创 多线程练习

IP 地址归属地批量查询任务(用构造子类的方法) from threading import Thread import requests import json class Ip_Addr(Thread): def __init__(self,ip): super(Ip_Addr, self).__init__() self.ip = ...

2019-07-22 17:17:31 153

原创 多任务编程,多线程编程,协程

文章目录一. 多任务编程二. 多进程编程(一) 基本概念(二)进程的创建一. 多任务编程定义: 操作系统可以同时运行多个任务。 比如 : 可以同时上网,同时听歌,同时用电脑赶作业。 这就是多任务 。单核CPU 实现多任务操作系统轮流让各个任务交替执行,每个任务执行0.01 秒,这样反复执行。 表面上看是每个任务交替执行,但CPU 的执行速度非常快,因此感觉所有任务都是同时执行的。...

2019-07-22 15:54:12 274

原创 Redis编程

文章目录一. Redis 简介二. Redis 的架构模式一. Redis 简介NoSQLNoSQL : Not Only SQL: 非关系型数据库优点: 有高扩展性,分步式计算,低成本,架构的灵活性, 半结构化数据,没有复杂的关系缺点: 没有标准化, 有限的查询功能,最终一致是不直观的程序Redis 简介Redis 是一个开源的使用ANSI C 语言编写,支持网络,可以...

2019-07-22 10:26:19 180

原创 关系对象映射

一. 简介ORM: 对象关系映射

2019-07-22 09:37:27 373

原创 数据库

文章目录一. 数据库的简介二. MySQL 数据库的基本操作(一) 数据库的操作(二) 数据库中表的操作(三) 查询操作一. 数据库的简介数据库系统解决的问题: 持久化存储,优化读写,保证数据的特征数据库的分类:1)文档型:eg: sqlite, 就是一个文件,通过对文件的复制完成数据库的复制2) 服务型: eg:mysql ,postgre, 数据库存储在一个物理文件中,但是需要使用...

2019-07-19 00:27:21 148

原创 贪心算法和动态规划

文章目录1. 定义2. 最优装载问题3. 背包问题1. 定义贪心算法其实就是在面对问题求解的时候,选择最优的解决方案。也就是说不从整体加以考虑,他所做出的仅仅是在某种意义上得到局部最优(是否是全局最优还有待证明。)2. 最优装载问题运古董,每一件古董的固定重量是w , 总最大承载数是C, 求怎么样可以装走的古董价值最大?这道题实际上就是求解最优解,即装走古董的总价值最大思路:1) ...

2019-07-18 22:59:52 864

原创 查找算法

文章目录一. 查找表1.定义2. 分类3. 关键字二. 顺序查找算法1. 算法描述一. 查找表1.定义查找表是由同一类型的数据元素构成的集合。对于查找表的操作:1)在查找表中查找某个具体的数据元素2)在查找表中插入数据元素3)从查找表中删除数据元素2. 分类1)静态查找表在查找表的时候只做查找的操作,而不改动表中的数据元素,称此类查找为静态查找表。2)动态查找表在查找表中只...

2019-07-18 21:58:52 139

原创 排序算法

文章目录一. 排序算法1. 定义2. 稳定与不稳定3. 内排序和外排序4. 排序算法的性能影响因素5. 排序算法的分类二. 冒泡排序1. 定义2. 冒泡算法的步骤3. 冒泡排序的复杂度分析三. 快速排序1. 基本思想2. 时间复杂度四. 直接插入排序一. 排序算法1. 定义假设含有n 个记录的序列{r1 , r2 ,r3, …,rn},其相对应的关键字分别为:{k1 , k2, …, kn}...

2019-07-18 17:31:34 110

原创 链表

一. 链表的基本概念链表与顺序表顺序表: 顺序表的构建需要预先知道数据的大小来申请连续的存储空间。而在进行扩充的时候又需要进行数据的搬迁,所以使用起来并不是很灵活。链表: 是一种线性表,是在每一个节点(数据存储单元)里面粗播放下一个节点的位置(即地址)。链表可以充分利用计算机的内存空间,实现灵活的内存动态管理顺序表和链表存储的对比:顺序表和链表插入删除方面时间复杂度:二. ...

2019-07-18 14:58:08 120

原创 顺序表

一. 顺序表的基本形式顺序表: 将元素有序的存放在一块连续的存储区里面,元素间的顺序关系由他们的存储顺序自然表示。顺序表的基本形式a : 每个元素所占的存储单元大小固定相同b: 每个元素所占的存储单元大小不相同,存储一个链接地址二. 顺序表的结构与实现顺序表的结构:一个顺序表的完整信息包括:1) 表中元素的集合2) 表的整体信息: 元素存储区的容量和元素的个数顺序表...

2019-07-18 13:56:38 676

原创 数据结构基础

数据结构(一) 算法算法的引入:算法是指解题方案的准确且完整的描述,是一系列解决问题的清晰指令,算法代表的是用系统的方法描述解决问题的策略机制算法的特性:1) 输入: 有0个或者多个输入2) 输出: 至少有一个或者多个输出3) 有穷性: 有限的步骤结束后就会自动结束4) 确定性: 每一步都有自己的含义5) 可行性: 每一步算法都是可行的算法效率衡量(1) 执行时间...

2019-07-18 10:29:19 227

原创 面向对象进阶

一. 元类1.类是一组用来描述如何生成一个对象的代码段。在python中 , 类也是一个对象。当使用class 关键字创建类的时候, python 解释器在执行的时候会创建一个对象 。 (python中一切皆对象)2. 类的本质是对象,那么我们就可以对类进行:1)可以将类赋给一个变量2) 可以拷贝一个类3) 可以给类增加属性4) 可以将类作为函数的参数进行传递3. 动态创建类ps...

2019-06-25 12:59:44 184

原创 魔术方法

1.特殊属性:__ name__ : 类,函数,方法等的名字__ modue__ : 类定义所在的模块__ class__: 对象或者类所属的类__ bases__: 当前类的父类(基类)__ doc__ : 类,函数的帮助文档,没有定义的时候为None__ mro__ : 方法解析顺序__ dict__: 类或者实例的属性,可写的字典__ dir__: 返回类或者对象所有成员的...

2019-06-25 10:39:45 166

原创 面向对象高级特性

一. 属性和类(一). 类属性和实例属性1.定义类属性:是类拥有的属性,它被类对象的实例对象的实例对象所共有的,在内存中只有一个内存。实例属性(对象属性):实例化对象所拥有的属性(有多少个对象,就有多少份属性)类方法:是类拥有的方法,它被类的对象所调用。当对象没有所具有的属性时,调用类的属性调用person1 ,person2 , person3的country 属性,当对象没有c...

2019-06-20 00:53:24 204

原创 基础知识(七)——高级特性

一.生成式与生成器。1.列表生成式。列表生成式是一个用来生成列表的特定语法形式的表达式。 是python提供的一种生成表的特定语法形式的表达式。eg . 求50个数的平方。运行结果:eg .(1) 求以r为半径的圆的面积和周长(r的范围是1到10)(2)求100内的所有偶数。运行结果为:2.生成器。1)定义:在python中,一边循环一边计算的机制,称为生成器。(Gener...

2019-06-12 23:46:39 313

原创 面向对象编程

面向对象的三大特性: 封装 , 继承 和多态一. 面向过程编程1.定义:是一种以过程为中心的编程思想。这些都是以什么正在发生为目标进行编程,不同于面向对象的是谁在受影响。于面向对象明显 的不同就是封装,继承和类。2.特点: 模块化 , 流程化3.优点: 性能比面向对象高,因为类调用时需要实例化,开销比较大,比较消耗资源;单片机,嵌入式开发,Linux / Unix 等一般采用面向过...

2019-06-11 11:30:21 1996

原创 Python 基础知识(十)——垃圾回收机制

模块

2019-06-10 19:56:30 177

原创 python基础知识(八)——模块和包

模块1.定义:模块就是工具包,要想使用这个工具包中的工具(好比是函数),就需要导入这个模块。(模块是非常简单的Python文件,单个python文件就是一个模块,两个文件就是两个模块)2.模块的导入方法:1) import 模块1 , 模块22)import 模块名.函数名3)from 模块名 import 函数名 / 变量名4) import 长模块名 as 短模块名5) f...

2019-06-10 17:50:33 199

原创 python基础知识(九) —— 异常

异常处理定义:异常指的是一个事件,该事件在程序执行过程中发生,影响程序的正常执行。(当python脚本发生异常时,我们需要捕获处理它,否则程序会中止执行)异常处理机制:1)try 的工作原理:当开始一个try语句之后,python就会在当前程序的上下文做标记,这样当异常出现时,就会回到这里,try语句先执行,接下来执行什么取决于在执行的过程中是否出现异常。2) except: 当...

2019-06-08 00:13:40 160

原创 python 基础知识(五)——函数

一. 函数的基础知识。1.定义:具有独立功能的代码块组织为一个小模块,称作是函数。在开放程序时,某块代码需要调用多次,为了提高编写的效率,因此我们会调用函数来解决问题。2. 函数的创建和调用。(1)函数的创建。用 def 来创建,定义一个函数。(ps :pass 的作用:1) 可以用来定义一个空函数,什么都不做的函数,用pass语句来写。2) 用作占位。在编写程序时,某块代码过于...

2019-05-28 09:21:36 329

原创 python基础知识(六)——文件

一.文件的操作介绍(1)文件的打开与关闭打开:用open函数打开一个已经存在文件或者创建一个新文件。eg . f = open("python.txt ",‘w’)文件的打开方式:(ps . 要读取二进制文件,比如图片,视频等时,用‘rb’ , ‘wb’ 'ab’等模式打开)对文件file 对象:1)file.closed 如果文件关闭了,返回true,否则,返回False2)...

2019-05-27 23:56:48 301

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除