Python
末日辰箫
小白学习大数据计算,机器学习/数据挖掘。
展开
-
knn算法学习笔记
主要介绍了knn的实现过程,包括归一化处理,中间数值计算中涉及到的矩阵操作。原创 2016-11-08 13:56:13 · 235 阅读 · 0 评论 -
python 时间差的计算
import timeimport datetimestart = datetime.datetime.now()time.sleep(30)end = datetime.datetime.now()print (end-start).days # 0 天数print (end-start).total_seconds() # 30.029522 精确秒数print (end-s原创 2017-07-27 19:35:23 · 14923 阅读 · 0 评论 -
百度2016校招:钓鱼比赛 Python
题目描述:ss请cc来家里钓鱼,鱼塘可划分为n*m的格子,每个格子有不同的概率钓上鱼,cc一直在坐标(x,y)的格子钓鱼,而ss每分钟随机钓一个格子。问t分钟后他们谁至少钓到一条鱼的概率大?为多少?输入描述: 第一行五个整数n,m,x,y,t(1≤n,m,t≤1000,1≤x≤n,1≤y≤m); 接下来为一个n*m的矩阵,每行m个一位小数,共n行,第i行第j个数代表坐标为(i,原创 2017-05-19 16:10:35 · 336 阅读 · 0 评论 -
基于随机采样获取训练、测试数据示例(Python)
import randomnPoints = 1000#随机获取x列表的数据xPlot = [(float(i)/float(nPoints) - 0.5) for i in range(nPoints + 1)]x = [[s] for s in xPlot]#运行一个随机种子random.seed(1)#在x的基础上进行数据的随机获取,每个数据在0.1范围内随机波动y = [s原创 2017-05-18 17:29:01 · 3004 阅读 · 0 评论 -
机器学习之特征工程
特征工程的相关讲解说明:http://www.cnblogs.com/jasonfreak/p/5448385.html转载 2017-05-16 14:47:35 · 269 阅读 · 0 评论 -
数据标准化处理
1. Std标准化处理xMeans = []xSD = []for i in range(ncols): col = [xList[j][i] for j in range(nrows)] mean = sum(col)/nrows xMeans.append(mean) colDiff = [(xList[j][i] - mean) for j in ra原创 2017-05-15 14:59:28 · 420 阅读 · 0 评论 -
KNN算法示例
# -*- coding: UTF-8 -*-import mathimport csvimport randomimport operator'''@author:hunter@time:2017.03.31'''class KNearestNeighbor(object): def __init__(self): pass def loa原创 2017-04-13 22:28:31 · 1687 阅读 · 0 评论 -
拉格朗日插值方法示例
from scipy.interpolate import lagrange #导入拉格朗日插值函数#自定义列向量插值函数#s为列向量,n为被插值的位置,k为取前后的数据个数,默认为5def ployinterp_column(s, n, k=5): y = s[list(range(n-k, n)) + list(range(n+1, n+1+k))] #取数 y = y[y.no原创 2017-04-11 19:32:51 · 1540 阅读 · 1 评论 -
解决Python查询Mysql数据库信息乱码问题
今天尝试着用 Python 写了个脚本试着连接 mysql 数据库,并查询里边的数据,不过最终查询结果中文字符变成了ascii格式。代码如下:#!/usr/bin/python#encoding=utf-8import MySQLdbimport jsondb = MySQLdb.connect(host='xxx.xxx.xx.xxx',port=3306,user='nam原创 2017-01-22 16:47:17 · 4334 阅读 · 0 评论 -
Python性能优化的20条建议
1. 优化算法时间复杂度算法的时间复杂度对程序的执行效率影响最大,在Python中可以通过选择合适的数据结构来优化时间复杂度,如list和set查找某一个元素的时间复杂度分别是O(n)和O(1)。不同的场景有不同的优化方式,总得来说,一般有分治,分支界限,贪心,动态规划等思想。2. 减少冗余数据如用上三角或下三角的方式去保存一个大转载 2016-12-22 16:42:03 · 178 阅读 · 0 评论 -
Python常见文件操作的函数示例
os.path 模块中的路径名访问函数分隔basename() 去掉目录路径, 返回文件名dirname() 去掉文件名, 返回目录路径join() 将分离的各部分组合成一个路径名split() 返回(dirname(), basename()) 元组splitdrive() 返回(drivename, pathname) 元组splitex转载 2016-12-21 18:26:09 · 182 阅读 · 0 评论 -
Python 文件读写操作实例详解
一、python中对文件、文件夹操作时经常用到的os模块和shutil模块常用方法。1.得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()2.返回指定目录下的所有文件和目录名:os.listdir()3.函数用来删除一个文件:os.remove()4.删除多个目录:os.removedirs(r"c:\python")5.检验给出的路径是否是一个文原创 2016-12-21 18:08:45 · 505 阅读 · 0 评论 -
PYthon os.path 访问函数
os.path 模块中的路径名访问函数分隔basename() 去掉目录路径, 返回文件名dirname() 去掉文件名, 返回目录路径join() 将分离的各部分组合成一个路径名split() 返回(dirname(), basename()) 元组splitdrive() 返回(drivename, pathname) 元组splitex原创 2016-12-21 18:07:41 · 243 阅读 · 0 评论 -
Python中OS模块使用说明
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cdos.curdir 返回当前目录: ('.')?1os.pardir 获取当前目录的父目录字符串名:('..')os.makedirs('dirname1/dirname2') 可生成多层递归目录os.rem原创 2016-12-21 18:05:54 · 986 阅读 · 0 评论 -
python中map和reduce的应用
map和reduce在那篇经典的论文 《MapReduce: Simplified Data Processing on Large Clusters》中这么定义MapReduce is a programming model and an associated implementation for processing and generating large data sets.原创 2016-12-21 18:04:36 · 385 阅读 · 0 评论 -
python常用模块大全
本篇文章列举了python中常用的模块以及目录转载 2016-12-21 17:46:18 · 1633 阅读 · 0 评论 -
随机梯度下降法
文章请看:http://blog.csdn.net/zbc1090549839/article/details/38149561转载 2017-09-11 14:32:15 · 401 阅读 · 0 评论