- 博客(11)
- 收藏
- 关注
原创 数据集的划分
数据集的概念 数据集的划分 训练集、验证集、测试集必须同分布,且通过均匀随机抽样的方式将数据无交集地划分为三个集合。 常见的划分方法: 1. 按比例划分:通常按8:1:1的比例进行划分 2. n折交叉检验法/留一法(适用于样本数较少的数据集):将样本数据打乱,分成n份,用...
2020-01-30 16:42:45 9884 1
原创 python中if __name__ == "__main__"的原理与作用
引入在很多python代码中,常常会出现一个分支语句:if __name__ == "__main__",当包含这个语句的代码作为脚本文件直接运行时,这一个分支语句下的代码是会被执行的,但是当这个代码被作为模块导入到其他python代码中,这个分支语句下的代码将不会执行。那为什么会出现这样的情况呢?这个语句能够帮助我们完成什么事情呢?接下来我们将一起探讨。示例1.直接作为脚本文件...
2019-03-05 19:37:15 378
原创 机器学习之聚类任务的经典算法(未完,本月内将持续更新)
一、聚类算法的基本类型:1. 划分聚类:算法通过不断迭代得到样本数据的最优分配,但由于其本质是贪心算法,因此它可能得到的是局部最优解。经典算法:k-means算法2. 层次聚类:在不同的层次上对数据集进行划分,从而形成树形的聚类结构。可以采用“自底向上”或“自顶向下”的策略进行划分。经典算法:AGNES(AGlomerative NESting)算法3. 密度聚类:
2018-01-15 17:03:56 1019
原创 聚类算法基础知识(更新中)
一、 什么是聚类: 聚类分析就是在相似的基础上收集数据进行分类。即将数据集按照数据之间的相似性划分为由若干个相似对象组成的多个组或簇的过程,让同一组/簇中的对象的相似度达到最大值,而不同组/簇的对象的相似度最小化。 通过聚类分析,人们能够发现数据全局的分布模式以及数据属性之间一些有趣的相互关系。二、 聚类与分类的区别: 分类是有监督学习,是对已经有标注的语料(类别已知)进行分类;而聚
2017-09-01 16:57:09 2061
原创 python中的编码问题
一. 相关概念: 1.字节(Byte):计算机中数据存储的基本单位,一个字节是八个位的.计算机上所有的数据都是由字节组成的 2.字符:字符是一个信息单位,是各种文字和符号的统称. 3.字符集(Characterset):是某个范围内字符的集合,不同的字符集规定了字符的个数.如ASCII,GB2312 4.字符码(code point):字符集中每个字符的数字编号 5.字符编码(charac
2017-08-30 11:46:05 375
原创 在python上操作MySQL数据库
要在python上操作MySQL,有以下步骤: 1.连接MySQL数据库conn = MySQLdb.connect( host='192.168.235.36', # 输入数据库的IP地址,如果是本地的数据库直接输入localhost即可 port=3306, # 接口 user='chili_select', passwd='chili_select
2017-08-30 10:19:14 641
原创 匿名函数lambda
在python和C++中,lambada表达式是能嵌入到其他表达式中的匿名函数.匿名函数是当我们需要一个函数,但又不想给这个函数命名,特别是当这个函数只是使用一次的时候(一个函数只使用一次并且它的名字无关重要) ,通常会选择使用匿名函数. 为了方便理解,直接举一个实例:list = [1, 2, 3, 4, 5]result = map(lambda x : x*x, list)print
2017-07-30 16:18:46 444
原创 python的map函数使用
map(function, list) 即:map(一个可迭代函数,一个列表) map函数可以用于在列方向上对列表进行处理map函数有如下3种使用情况:1.对可迭代函数中的每一个元素使用该方法,结果作为列表返回:e.g.def add20(number): number = number+20 return numberlist = [1,2,3]newlist = map(a
2017-07-30 13:39:03 1184
原创 numpy.sum()的使用
numpy的sum函数可接受的形参是:sum(a, axis=None, dtype=None, out=None, keepdims=np._NoValue)a是要进行加法运算的向量/数组/矩阵 axis的值可以为None,也可以为整数和元组 其形参的注释如下: a : array_like Elements to sum. (用于进行加法运算的数组形式的元素) axis :
2017-07-28 11:57:07 168352 13
原创 《think Python》学习笔记
l 初识python:Python:解释性语言,是由解释器运行的(使用解释器的两种方法:交互模式&脚本模式)l 解释器:每转译一行程序叙述就立刻运行,然后再转译下一行,再运行l 脚本:将代码存储在文件中,用解释器运行文件内容Python脚本用.py结尾l 交互模式VS脚本模式:交互模式:键入表达式则可以获得运算结果脚本模式:若无打印指令,不会显示结果(实际上计算
2017-05-14 14:58:33 666
原创 mongodb的基本操作命令
1.在终端连接mongodb: mongo 成功连接上mongodb的终端界面显示 2.关闭mongodb: sudo service mongodb stop 3.开启mongodb: sudo service mongodb start 4.查看数据库: show dbs(注意,是dbs不是db) 5.创建新的数据库: use Leeki
2017-05-13 18:22:21 435
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人