《流畅的Python》读书笔记

博客目录: 《流畅的Python》 读书笔记1-序列 《流畅的Python》读书笔记2-函数的参数 《流畅的Python》读书笔记3-operator模块和functools模块 《流畅的Python》读书笔记4-函数装饰器和闭包详解 为什么看这本书? 很早就总各种方面接触到 Py...

2018-07-26 00:16:14

阅读数 347

评论数 0

退役

因为个人原因退役了 大学的acm生涯算是戛然而止 没什么特别出彩的地方(虽说刚开始是蛮不错的 想着与其带着无聊的心情再去打几次比赛不如趁早抽身 最近找到了以前选的导师开始想往数据分析的方面发展 说来说去还是有点小遗憾吧 不管是自己还是老师同学 都为我感到一点惋惜 ...

2018-03-11 12:25:38

阅读数 229

评论数 4

SQL创建、查询、过滤、多表查询

《SQL学习指南》简要笔记 1 SQL创建 1.1 使用mysql命令行 $mysql -u root -p [密码] bank -P3306 表示用root用户登录并使用数据库bank,密码可以为空,端口为3306,省去了每次输入use bank的SQL命令。 输入quit/exit退出。 1....

2019-04-23 23:21:25

阅读数 34

评论数 0

Python链家租房信息爬虫

爬取链家某地区(杭州,南京等)租房信息爬虫。链家只开放了前100页供查看,每夜30条,因此实际上只爬取了前3000条信息。 对于项目需求需要分析某地区某段时间内发布的租房信息,爬取对应的名称name,地区dist,面积square,价格price,备注detail,用pandas.DataFram...

2019-03-11 09:31:36

阅读数 50

评论数 0

Nginx+uWSGI+Flask+https配置

关于Nginx和uWSGI之间的关系,部署等等网上已经有很多抄来抄去的资料了,这里记录下小白第一次实践尝试的结果。按照自底而上的顺序写。 文章目录1 Nginx/uWSGI/Flask/SSL证书是什么1.1 Nginx1.2 uWSGI1.3 Flask1.4 SSL证书2 创建Flask程序3...

2019-02-13 00:04:05

阅读数 183

评论数 0

Dijkstra算法的Python实现

将图上的顶点分为已访问visited和未访问node两个集合. 每次从visited向外拓展一个点,拓展规则是在可更新的点里是距离最小的. 算法伪代码: def dijkstra(): 初始化 visited 和 node 集合,distance[] visited 加入源节点 ...

2019-01-29 13:18:17

阅读数 81

评论数 0

光伏发电预测(二)

赛题的决赛要求: 利用之前若干时段的光伏发电参数,预测未来两个月的每天15分钟一次共96个点的瞬时功率。 先对数据集模糊聚类,再用相似日得出预测日的除了瞬时有功以外的所有参数,最后用神经网络计算预测日的瞬时有功。 一、数据分析 原始数据表“data.csv”,提供了用户A1-A10的2016年7月...

2018-12-30 01:06:40

阅读数 643

评论数 17

光伏发电预测(一)

最近参加了一个光伏发电预测的比赛,第一次接触这类课题,看了很多关于光伏发电预测和负荷预测的论文,算是入了一个门。主要工作还是在数据清理上和特征工程上。做好了这两项后面的预测过程倒是比较简单。比赛要求:利用之前若干时段的光伏发电参数,预测未来两个月的正向有功总电量。 具体见下文。 一、数据分析 原始...

2018-12-30 00:26:17

阅读数 1140

评论数 2

有道词典爬虫

文章目录有道词典爬虫代码实现 有道词典爬虫 构造url对单个单词的释义及例句进行爬虫。 查询界面不需要登陆操作,用 GET 方法获取源代码。 对于上图所示的单词查询界面,简单地对单词’scene’ 进行替换即可。 很久没有用xpath解析,有点生疏。 从审查元素可以看到每个例句都被&a...

2018-12-11 18:50:56

阅读数 162

评论数 0

爬取vjudge的比赛代码和相关信息

文章目录概述开发过程代码结构源代码怎样使用 github 地址:https://github.com/Joovo/vjudge_spider 概述 爬虫的目的是作为 contest 管理员需要统计 contest 下参赛者的错误信息并下载所有参赛者代码。 代码实现的是分题号分别统计 Wrong A...

2018-12-09 02:57:39

阅读数 391

评论数 2

tensorflow实现线性回归

文章目录计算图归一化实现梯度下降手动梯度下降自动微分 用 tensorflow 实现一个线性回归程序简单了解tensorflow的一些基本操作。 计算图 tensorflow 的本质是用Python构建一个计算图,然后用优化后的C++代码来运行这个图,因此适用于大型机器学习和分布式计算中。 构建一...

2018-12-06 01:33:43

阅读数 87

评论数 0

Adaboost 元算法改进分类性能

文章目录概述bagging 自举汇聚法Adaboost 元算法AdaBoost的一般流程更新规则:单层决策树`decision stump`基于 DS 建立 Adaboost完整代码,预测患有疝病的马是否能够存活 概述 元算法(meta-algorithm)或集成方法(ensemble metho...

2018-11-22 01:34:10

阅读数 171

评论数 0

《流畅的Python》12-构造对象

构造对象的常用到几个概念: super(),__new__,__init__ __new__和__init__ 一般将__init__称为构造方法,实际上 __new__用于实例化类,__init__用于初始化实例。 Python构造对象的伪代码: def object_maker(the_cla...

2018-11-15 22:33:05

阅读数 60

评论数 0

SVM的分类超平面的数学推导

给出数学推导,每个向量的意义不再赘述 转换原问题 确定每个支持向量下的超平面:min y(w^T+b)/||w|| 间隔最大的为所求最优的超平面 max min y(w^T+b)/||w|| , 即求: arg ma...

2018-10-25 01:31:02

阅读数 411

评论数 0

线性回归 Python 语言实现

先占一个坑,最近几周在做一个比赛,十一月份回来补 代码发上来注释掉免得又鸽了。。。。 《机器学习实战》这本书有几点不适合入门者深入学习的地方是关键代码没有给出具体原理,而介绍方式是对机器学习每个基础算法进行讲解,所以经常在学习几个章节之间会感觉到断层,需要其他一些地方自行理解。线性回归这章后面的优...

2018-10-24 18:36:32

阅读数 58

评论数 0

线性回归系数,局部加权线性回归系数的数学推导

用最小二乘法Ordinary Least Square即通过最小化误差的平方和寻找数据的最佳函数匹配 ∑i=1m(y−xiTw)2 \sum_{i=1}^{m}(y-x_i^Tw)^2 i=1∑m​(y−xiT​w)2 用矩阵表示: (y−Xw)T(y−Xw) (y-Xw)^T(y-X...

2018-10-18 18:09:20

阅读数 230

评论数 0

最大似然函数

补一下概率论的知识,不会还得翻书,稍微记一下几个点。 1.MLE:最大似然估计 2.确定最值点:∂∂θjL=0或∂∂θjlnL=0\frac{\partial}{\partial \theta_j}L=0 或 \frac{\partial}{\partial \theta_j}ln L=0∂θj​...

2018-10-12 10:41:24

阅读数 90

评论数 0

逻辑回归分类器(Logistic Regression)

目录 Logistic回归概述 Logistic回归分类器,Sigmoid 函数 最优化理论确定回归系数(weight) 梯度上升法 数学推导 随机梯度上升 处理数据的缺失值 实例:预测病马死亡率 吃了概率论的亏 逻辑回归(Logisti...

2018-10-11 18:26:07

阅读数 126

评论数 0

朴素贝叶斯分类器-文档分类

朴素贝叶斯理论概述 条件概率 用朴素贝叶斯进行文档分类 文本分类代码 文档词袋模型 实例:朴素贝叶斯过滤垃圾邮件 朴素贝叶斯理论概述 朴素贝叶斯(navie bayes)是贝叶斯决策理论的一部分,只考虑最简单的假设,用 Python 将文本切分为词向量,然后利用词向量对文档分类。 优点:在数...

2018-10-08 21:21:34

阅读数 224

评论数 0

concurrent.futures 并发爬取 wos 的部分专利号和施引专利

工作上需要爬取 wos 的一些专利号和施引专利,做成了一个 excel 表格。施引专利在系统默认的导出里是没有的。 第一次实际运用了concurrent.futures 来处理并发下载,确实很简单。一开始用 scrapy 框架貌似连接非常慢,不知道什么原理,三次连接两次超时,于是手写了一个用很多...

2018-10-06 22:27:19

阅读数 182

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭