python
文章平均质量分 52
littlely_ll
Strive for the best, and prepare for the worst.
展开
-
tensorflow estimator的使用
estimator是tensorflow的一个高级API,它的好处就是不用关注底层的物理设备,在cpu,tpu、gpu下运行或者使用分布式训练都不用修改代码。本文档旨在走通estimator的整个流程,其中一些数据处理和图的构建可能不太合理,可根据自己实际情况进行改进。tensorflow:1.14.0python: 3.6.5构建input_fnimport tensorflow as tf# 设置log级别tf.compat.v1.logging.set_verbosity(tf.logg原创 2020-10-13 16:31:35 · 4124 阅读 · 1 评论 -
对象浅复制和深复制的几个问题
一、“==”与“is”==运算符是比较的两个对象的值,而is比较的是对象的标识。例如:a = [1,2,3]b = ac=list(a) a == b == c ##返回Trueid(a) == id(b) ##返回Trueid(a) == id(c) ##返回False这里a指向对象[1,2,3],而b是对象[1,2,3]的别名,也就是说,a和b都指向[1,2,3]这个对象,所以他们的值原创 2017-08-20 18:47:10 · 354 阅读 · 0 评论 -
python实现各种排序算法
python排序算法# -*-encoding: utf-8 -*-# param: a a list which to be sortclass MultiSort(object): # 交换函数 def exch(self, a, i, j): temp = a[i] a[i] = a[j] a[j] = temp原创 2017-09-25 20:41:26 · 1635 阅读 · 0 评论 -
K-Prototypes聚类的Python实现
k-prototypes聚类 前一篇讲述了K-Prototypes聚类的原理以及它的伪代码,本篇根据上一篇内容编写了实现K-Prototypes的Python代码。# -*- coding: utf-8 -*-import numpy as npimport randomfrom collections import Counterdef dist(x, y): retu...原创 2018-04-22 21:04:15 · 14334 阅读 · 21 评论 -
networkx包初探
networkx是python的一个包,它是用来复杂网络结构的创建、操作和学习。官网上给它设定的目标为: tools for the study of the structure and dynamics of social, biological, and infrastructure networks, a standard programming interface and...原创 2018-08-16 22:23:18 · 4514 阅读 · 0 评论 -
spyder快捷键
spyder快捷键原创 2018-08-28 17:38:30 · 529 阅读 · 0 评论 -
使用sqlalchemy ORM创建表及数据的插入
1.载入库import timeimport datetimeimport pandas as pdimport sqlalchemyfrom sqlalchemy import create_enginefrom sqlalchemy.sql import text, funcfrom sqlalchemy.orm import sessionmaker,relationsh...原创 2018-09-14 17:58:38 · 15359 阅读 · 0 评论 -
pandas DataFrame的使用
DataFrame使用apply函数df = pd.DataFrame({'x':[1,2,3,4,5],'y':['a','a','b','b','c']})df x y0 1 a1 2 a2 3 b3 4 b4 5 c要使得df的x和y值拼接起来,增加为一列,可以使用apply函数:def f(df): return str(df.x...原创 2018-10-23 20:56:03 · 1819 阅读 · 0 评论 -
Cython基础
cdefcdef是告诉编译器这条语句是C类型的语句,例如:#pysum.pyxcdef int Csum(int a, int b): return a + b它和真正的C语言定义的函数有一些区别,例如c用{}包裹函数体,而cdef用:定义。python中不能直接调用cdef定义的函数(直接调用cdef定义的函数会出现ImportError:cannot import nam...原创 2018-12-23 14:45:38 · 3856 阅读 · 1 评论 -
matplotlib作图添加表格
import matplotlib.pyplot as pltimport numpy as npplt.figure()ax = plt.gca()y = np.random.randn(9)col_labels = ['col1','col2','col3']row_labels = ['row1','row2','row3']table_vals = [[11,12,13],[21,原创 2017-07-08 21:21:50 · 14888 阅读 · 0 评论 -
matplotlib作图布局
plt.figure(0)axes1 = plt.subplot2grid((3,3), (0,0), colspan=3)#(0,0)开始,占3列axes2 = plt.subplot2grid((3,3), (1,0), colspan=2)#(1,0)开始,占2列axes3 = plt.subplot2grid((3,3), (1,2))axes4 = plt.subplot2grid原创 2017-07-08 21:19:24 · 636 阅读 · 0 评论 -
《机器学习实战》决策树
《机器学习实战》K近邻(KNN)分类 上一章写了K近邻分类(见上链接),本章将学习决策树的python实现,虽然K近邻在大多数的时候工作很好,但是没有一个直观的认识,而决策树可以将分类视觉化,使人们对其分类一目了然,当然,对于大型的决策树还是很难进行阅读的。本次的实现决策树只生成树,画出树图,不剪枝。python实现决策树##function to calculate the S原创 2017-01-10 20:43:30 · 377 阅读 · 0 评论 -
python小函数(一)
1. shape函数numpy模块 shape(a) - a: 数组np.shape(np.eye(3)) ## 返回结果 (3L, 3L)np.shape([[1, 2]]) ## 返回结果(1L, 2L)np.shape([0]) ##返回元组## (1L,)shape(0) ##返回空元组## ()a = array([[3,4,5],[6,3,6]原创 2016-12-28 15:14:31 · 949 阅读 · 0 评论 -
《机器学习实战》朴素贝叶斯(Naive Bayes)分类
1. 《机器学习实战》K近邻(KNN)分类 2. 《机器学习实战》决策树 \quad对于朴素贝叶斯理论分析可看朴素贝叶斯法及其R实现 ,对于这篇的R实现,只是在这种特殊情况,对于一般的情况并没有实现,所以,本篇文章使用python实现朴素贝叶斯分类的一般方法,并对垃圾邮件进行分类。##word list vector functiondef loadDataSet(): posti原创 2017-01-20 11:47:16 · 1036 阅读 · 0 评论 -
《机器学习实战》logistic回归
《机器学习实战》K近邻(KNN)分类《机器学习实战》决策树《机器学习实战》朴素贝叶斯(Naive Bayes)分类 \quad上一章学习了朴素贝叶斯分类器,贝叶斯分类器在文本分类方面表现很好,贝叶斯分类器是基于概率的分类器,而本章的logistic回归也可以说是基于概率的分类,虽然其名为带“回归”两字,其实是一种分类器。Logistic回归采用的是sigmoid函数,其取值在0~1之间。在分类原创 2017-01-23 21:44:31 · 422 阅读 · 0 评论 -
python scipy和scikit-learn包的安装
众所周知,python中一些包的安装最简单的方法就是pip install或easy_install,但这些方法也有失灵的时候,今天我安装scipy和scikit-learn的时候总是出现错误,在网上找了许多方法,但大部分非常麻烦,有的还要设置环境的什么的,我也最讨厌复杂安装的东西,不过在stackoverflow中找到了一个比较简便的方法,就是先从python扩展库下载好文件,然后再pip ins原创 2017-02-24 22:17:30 · 1324 阅读 · 0 评论 -
centos中安装Python2.7
转载于:秋水逸冰 » CentOS 6.8安装Python2.7.13查看当前系统中的 Python 版本python –version 返回 Python 2.6.6 为正常。检查 CentOS 版本cat /etc/redhat-release 返回 CentOS release 6.8 (Final) 为正常。安装所有的开发工具包yum groupinstall -y “Developme转载 2017-05-03 21:05:15 · 789 阅读 · 0 评论 -
使用hadoopstreaming计算航空平均迟到时间
下属内容为本人的学习笔记:#!/usr/bin/env pythonimport sysimport csvSEP = "\t"class Mapper(object): def __init__(self, stream, sep=SEP): self.stream = stream self.sep = sep def emit(self, k原创 2017-05-28 18:03:16 · 600 阅读 · 0 评论 -
遗传算法及其实现
遗传算法是计算数学中用于解决最优化的搜索算法,是进化算法的一种。它是借鉴了生物进化学中的一些现象而发展起来的,这些现象包括遗传,突变,自然选择以及杂交等。遗传算法的思想遗传算法是模拟生物学种的进化论,物种朝着有利于自己的方向发展,这在遗传算法中表现为朝着最优化的方向发展。在进化过程中,遗传算法模拟基因的行为,首先选择有优势的基因,并对基因进行配对,然后等位基因进行交换,并有一定的概率进行基因变异,这原创 2017-05-19 10:45:38 · 3295 阅读 · 0 评论 -
spark分析航班总拖延时间
import csvimport matplotlib.pyplot as pltfrom StringIO import StringIOfrom datetime import datetimefrom collections import namedtuplefrom operator import add, itemgetterfrom pyspark import SparkCo原创 2017-06-11 22:04:15 · 841 阅读 · 0 评论 -
《机器学习实战》K近邻(KNN)分类
R与Python在机器学习中的比较\quad最近开始用python实现机器学习算法,通过对比R与python实现机器学习算法,本人发现,用python实现算法比R实现算法更好理解。使用python能让你理解算法的每一步是怎样做的,而在R中,只有一个实现算法的函数和其中要设置的参数,虽然只要理解机器学习算法的内容就能知道参数所代表的含义进而设置其中的参数,但是R中的计算就像一个黑盒子,不知道过程是怎样原创 2017-01-09 16:49:23 · 566 阅读 · 0 评论