自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (1)
  • 收藏
  • 关注

原创 KNN算法(K近邻算法)

算法简介KNN算法中文名称叫做K近邻算法,是众多机器学习算法里面最基础入门的算法。它是一个有监督的机器学习算法,既可以用来做分类任务也可以用来做回归任务。KNN算法的核心思想是未标记的样本的类别,由距离他最近的K个邻居投票来决定算法三要素(1).k值的选取对于k值的选择,没有一个固定的经验,一般根据样本的分布,选择一个较小的值,可以通过交叉验证选择一个合适的k值。选择较小...

2019-10-31 20:40:12 1447

原创 python必备小技巧(二)

本章接着上篇文章讲一.推导式列表推导式是Python基础,好用,而又非常重要的功能,也是最受欢迎的Python特性之一。本质上可以把列表推导式理解成一种集合了变换和筛选功能的函数,通过这个函数把一个列表转换成另一个列表的过程普通推导式# 简单列表推导式list1 = [i for i in range(5)]print(list1)# 生成偶数(1-10之间)list2 =...

2019-10-27 17:23:27 369

原创 逻辑回归

逻辑回归介绍逻辑回归是一种广义线性回归,本质上与多元线性回归相差无几。相当于将回归的结果带入 sigmoid 函数进行缩放,使得最终结果为二分类原理与预测函数预测函数,拿我们讨论的最标准的二分类来说,分别计算p(y=1|x),p(y=0|x)哪个条件概率大就分到哪一类损失函数的推导反映了两个概率分布之间的差异信息,其中p表示真实分布,q表示非真实分布,即反应我们推测的分布和真实分布...

2019-10-26 21:58:00 922

原创 使用python计算身份证号码(time模块和datetime模块)

本文章需要的使用到time模块,故先从time模块和datetime模块讲起.python之time模块需要注意的是在time模块中的大多数函数是调用了所在平台C library的同名函数, 所以要特别注意有些函数是平台相关的,可能会在不同的平台有不同的效果。另外一点是,由于是基于Unix Timestamp,所以其所能表述的日期范围被限定在 1970 – 2038 之间,如果你写的代码需要...

2019-10-24 19:36:16 1444

原创 线性回归以及非线性回归

一元线性回归只含有一个自变量,对应的方程是一条直线代价函数(损失函数)这个代价函数也称为平方误差代价函数思想:对于训练样本(x, y)来说,选择θ0,θ1 使h(x) 接近y选择合适的(θ0, θ1)使得代价函数最小...

2019-10-20 17:21:04 1495

原创 23个python爬虫开源项目代码

WechatSogou – 微信公众号爬虫基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典github地址:https://github.com/Chyroc/WechatSogouDouBanSpider – 豆瓣读书爬虫可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选搜罗,比...

2019-10-17 21:21:42 1304

原创 python必备小技巧

检验一个列表中的所有元素是否一样使用[1:]和[:-1]来比较给定列表的所有元素def all_equal(lst): return lst[1:] == lst[:-1] all_equal([1, 2, 3, 4, 5, 6]) # Falseall_equal([1, 1, 1, 1]) # True如果列表所有值都是唯一的,返回 True,否则 False在给定...

2019-10-17 19:23:47 207

原创 机器学习之基本概念

数据挖掘数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等训练集作用:估计...

2019-10-12 20:53:09 289

原创 数据分析之matplotlib详解

matplotlib介绍Matplotlib 是 Python 的绘图库。 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案。 它也可以和图形工具包一起使用,如 PyQt 和 wxPythonmatplotlib安装pip3 install matplotlib绘制常用图表一.折线图表示随着时间的推移某指标的变化趋势参数详解plt.plot(...

2019-10-11 21:40:43 868

原创 数据分析之pandas学习

pandas的安装pip3 install pandaspandas简介Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具pandas提供了大量能使我们快速便捷地处理数据的函数和方法它是使Python成为强...

2019-10-10 19:30:34 201

原创 数据分析之numpy学习

numpy的安装pip3 install numpynumpy的ndarray对象NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。ndarray 对象是用于存放同类型元素的多维数组。ndarray 中的每个元素在内存中都有相同存储大小的区域。numpy.array(object, dtype...

2019-10-09 21:56:52 265

原创 Python爬虫解析库之xpath解析库详解

xpath解析库详解简单说明XPath的选择功能十分强大,它提供了非常简洁明了的路径选择表达式。XPath相对于正则表达式显得更加简洁明了,对于网页的节点来说,它可以定义id、class或其他属性。而且节点之间还有层次关系,在网页中可以通过XPath来定位一个或多个节点规则表达式描述nodename选取此节点的所有子节点/从当前结点选取直接子节点//...

2019-10-07 19:52:02 984

原创 Python爬虫解析库之BeautifulSoup解析库详解

BeautifulSoup解析库详解BeautifulSoup是灵活又方便的网页解析库,处理高效,支持多种解析器利用它不用编写正则表达式即可方便地实现网页信息的提取安装pip3 install beautifulsoup4用法详解解析器使用方法优势劣势Python标准库BeautifulSoup(makeup,“html.parser”)python...

2019-10-06 15:28:15 1402 1

原创 Python爬虫解析库之pyquery详解

PyQuery解析库·详解安装pip3 install pyquery初始化的三种方法字符串初始化from pyquery import PyQuery as pqhtml = '''<div> <url> <li class='item-0'>first item</li> <li ...

2019-10-04 13:55:44 537

原创 LeetCode括号生成问题python动态规划解法

动态规划动态规划的三要素:最优子结构,边界和状态转移函数。最优子结构是指每个阶段的最优状态可以从之前某个阶段的某个或某些状态直接得到(子问题的最优解能够决定这个问题的最优解),边界指的是问题最小子集的解(初始范围),状态转移函数是指从一个阶段向另一个阶段过度的具体形式,描述的是两个相邻子问题之间的关系(递推式)重叠子问题,对每个子问题只计算一次,然后将其计算的结果保存到一个表格中,每一次需要...

2019-10-03 21:50:18 598

原创 Python的内存分配

sys模块getsizeof()方法:该方法用于获取一个对象的字节大小(bytes)getsizeof()方法只计算直接占用的内存,而不计算引用对象占用的内存下面给出一个例子import sysa = [1, 1]b = [a, a]sys.getsizeof(a)# 80sys.getsizeof(b)# 80# a,b都只有两个元素,所以直接占用的内存大小相等探...

2019-10-03 17:37:17 2228

Docker源码用于安装

Docker 是一个开源的软件部署解决方案。 Docker 也是轻量级的应用容器框架。 Docker 可以打包、发布、运行任何的应用。 Docker 就像一个盒子,里面可以装很多物件,如果需要某些物件,可以直接将该盒子拿走,而不需要从该盒子中一件一件的取。 Docker 是一个客户端-服务端(C/S)架构程序。 客户端只需要向服务端发出请求,服务端处理完请求后会返回结果。

2020-10-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除