自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Python操作数据库

前几天数据库课程的一个小project,需要接入MySQL数据库,导入数据,写了个脚本,做简单的CRUD操作,用Python实现,简单地记录一下,原文见Python操作数据库。依赖可以用MySQL-python来连MySQL,安装很简单,pip install MySQL-python,然后在脚本里引入import MySQLdb即可。有不止一个库实现类似的功能,API大同小异。连接首先要...

2019-04-26 09:20:27 335

原创 Python itertools模块详解

该模块包含了一系列处理可迭代对象(sequence-like)的函数,从此迭代更任性,简要介绍,原文见Python itertools模块详解。迭代器有一些特点,比如lazy,也就是只有用到的时候才读入到内存里,这样更快更省内存;比如只能调用一次,会被消耗掉。import itertools as itls合并迭代器: chain()与izip()chain()函数接收n个可迭代对象,然...

2019-04-26 09:18:55 1825

原创 Python Collections模块解析

collections模块提供了一些python内置数据类型的扩展,比如OrderedDict,defaultdict,namedtuple,deque,counter等,简单实用,非常值得学习了解,简要介绍,原文见Python Collections模块解析。import collections1. OrderedDict顾名思义,有顺序的词典,次序不再是随机的。普通的dict不记录插入...

2019-04-26 09:17:56 306

原创 Python os模块实例

os模块操作文件、路径,是python比较常用的一个库,简要介绍,原文见Python os模块实例。# I use jupyter notebook to create some file!touch foo.txt!echo Hello > foo.txt!cat foo.txtHello# rename fileos.rename('foo.txt','bar.txt'...

2019-04-26 09:17:02 604

原创 Python zip模块

python里有专门处理压缩文件的包zipfile,可以进行压缩、解压等各种常见操作,简要介绍,原文见Python zip模块。判断是否是ZIP文件用zipfile.is_zipfile判断。import zipfileprint(zipfile.is_zipfile('samples/archive.zip'))TrueZipFile可以直接操作ZIP,支持读取数据以及对其修...

2019-04-26 09:15:57 1051

原创 Python正则表达式实例透析

python里的re模块专门处理正则表达式,功能灵活强大,简要介绍,原文见Python正则表达式实例透析 。re.search经常用match = re.search(pat, str)的形式。因为有可能匹配不到,所以re.search()后面一般用if statement。str = 'an example word:cat!!'match = re.search(r'word:\w\w...

2019-04-26 09:14:57 363

原创 Python处理Json数据

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。本文简要介绍Python中的相关操作,原文见Python处理Json数据。数据格式可以简单地理解为键值对的集合(A collection of name/value pairs)。不同的语言中,它被理解为对象(object),纪录(record),结构(str...

2019-04-26 09:12:50 3607

原创 Python文件读写

文件操作,无外乎读写,但首先你要打开文件,本文简要介绍,原文见Python文件读写 。打开文件f = open(filename, mode) filename是文件名,可以带目录;mode是读写模式(可以是读,写,追加等);f是file handler。关闭文件f.close()模式“r”: Open a file for read only“w”: Open a file fo...

2019-04-25 21:11:59 240

原创 Python glob匹配文件

glob的应用场景是要寻找一系列(符合特定规则)文件名,本文简要介绍,原文见Python glob匹配文件。glob模块是最简单的模块之一,内容非常少。用它可以查找符合特定规则的文件路径名。查找文件只用到三个匹配符:”*”, “?”, “[]”。”*”匹配0个或多个字符;”?”匹配单个字符;”[ ]”匹配指定范围内的字符,如:[0-9]匹配数字。假设以下例子目录是这样的。dird...

2019-04-25 21:10:57 351

原创 Python异常处理

异常处理是写出健壮程序的必备步骤,本文简要介绍,原文见Python异常处理。1.1 基本语法把可能抛出异常(出错)的语句放在try的block里,然后用except去扑捉(预判)可能的异常类型,如果异常类型match,就执行except模块。try: # write some code # that might throw exceptionexcept <Excep...

2019-04-25 21:09:43 125

原创 Python Logging模块

python的Logging模块专门提供日志相关的功能,简要介绍,原文见Python Logging模块。Quick Start导入模块后直接logging.waring(),logging.error()简单粗暴地调用即可。默认的level是DEBUG,所以warning会打印出信息,info级别更低,不会输出信息。如果你不知道level等参数的意义请后面解释,淡定,继续往下看。如果不特别...

2019-04-25 21:07:13 691

原创 Python函数式编程

用python也可以写出函数式风格的代码,原文见Python函数式编程.Mapmap()函数接收两个参数,一个是函数,一个是序列,map将传入的函数依次作用到序列的每个元素,并把结果作为新的list返回,比循环更简洁,更易读。# default functionname_len = map(len, ["Sam", "John", "Ned Stark"])print name_len...

2019-04-21 22:44:28 92

原创 很赞的开源小工具

最近整理了一些在用的,感觉还不错的开源小工具,有的仅适用MacOS,但多数跨平台,原文见很赞的开源小工具。HomebrewHomebrew — The missing package manager for macOS,Mac上非常好用的包管理工具,很多常见的安装都可以通过brew install app或者brew cask install app直接安装,类似apt-get。Oh My...

2019-04-13 10:20:12 859

原创 Mac必备软件

Mac上有很多优秀的软件,可以极大地提升效率和工作体验,原文见Mac必备软件效率工具Alfred效率神器,mac绝对必备。可以快速启动程序和全局搜索文件。安装好之后cmd+space调用Alfred,输入程序名即可调用程序;打一个空格再输入可以查找文件及文件夹。当然付费版可以自定义workflow,可以组合一连串的操作到一个快捷键。workflow可以整合terminal,浏览器,pytho...

2019-04-13 10:18:25 947

原创 经典决策树对比

关于经典决策树算法ID3、C4.5及CART树的部分细节梳理,原文见决策树算法。决策树决策树可以从两个视角理解。If-Then规则的集合定义在特征空间与类空间上的条件概率分布经典决策树对比经典决策树有ID3、C4.5以及CART树,其功能和学习过程各有异同,简单对比。算法分裂标准树类型特征类型缺失剪枝任务ID3信息增益多叉离散No无剪枝...

2019-04-11 22:05:29 1038

原创 经典损失函数一览

损失函数(Loss Function)用来估量模型的预测值 y^=f(x)\hat y = f(x)y^​=f(x) 与真实值 yyy 的不一致程度。这里做一个简单梳理,以备忘,原文见损失函数清单。回归问题常见的回归问题损失函数有绝对值损失、平方损失、Huber损失。绝对值损失又叫做L1损失。L(y,y^)=∣y−y^∣L(y, \hat y) = |y - \hat y|L(y,y^​...

2019-04-09 21:26:24 1614

原创 Linear/Logistic/Softmax Regression对比

Linear/Logistic/Softmax Regression是常见的机器学习模型,且都是广义线性模型的一种,有诸多相似点,详细对比之。原文见Linear/Logistic/Softmax Regression对比。概述Linear Regression是回归模型,Logistic Regression是二分类模型,Softmax Regression是多分类模型,但三者都属于广义线性「...

2019-04-09 21:23:22 967

原创 一文掌握XGBoost核心原理

XGBoost是经典的提升树学习框架,其配套论文和PPT分享也相当经典,本文简单梳理其思路,原文见XGBoost原理简介。整体思路和一般提升模型一样,提升树模型也遵循相同的范式采用加法模型「forward stage-wise manner」每轮引入一weak learner「此处是一棵CART树」学习之前weak learners的不足「用梯度表征」同时要考虑过拟合等问题「ove...

2019-04-09 21:21:17 596

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除