- 博客(26)
- 资源 (4)
- 收藏
- 关注
原创 matlab 函数笔记
1. 特殊变量与常数 主题词 意义 主题词 意义 ans 计算结果的变量名 computer 确定运行的计算机 eps 浮点相对精度 Inf 无穷大 I 虚数单位 inputname 输入参数名 NaN 非数 nargin 输入参数个数 nargout 输出参数的数目 pi 圆周率 nargoutchk
2017-10-29 12:56:45 808
原创 线性回归之特征归一化、步长选择、特征组合
针对ng上的线性回归课程,几个技巧性的方法,现整理如下: 在求解线性回归的模型时,有三个需要注意的问题一就是特征组合问题,比如房子的长和宽作为两个特征参与模型的构造,不如把其相乘得到面积然后作为一个特征来进行求解,这样在特征选择上就做了减少维度的工作。这个是多项式回归(Polynomial Regression)里面的一个重点问题。二就是特征归一化(Feature Scaling),这也是许多机器
2017-10-27 23:29:19 3957
原创 Machine Learning Stanford (week 2)
1. Multivariate Linear Regression1.1 Multiple FeaturesNote: [7:25 - θT is a 1 by (n+1) matrix and not an (n+1) by 1 matrix] Linear regression with multiple variables is also known as “multivariate lin
2017-10-27 22:30:49 818
转载 Markdown之列表&MathJax
下面说的Markdown的表格形式已经被用烂了,但是一直不怎么用Markdown里面的MathJax,实在不行就小窗截图,随着这个审美的不断提升,现在看那个实在是越来越丑啊,下面贴下转载的帖子,好好学习下。1. 前言Markdown是一种轻量级的标记语言,把作者从繁杂的排版工作中解放出来,实现易读易写的文章写作,已经逐渐成为事实上的行业标准。CSDN博客支持Markdown可以让广大博友更加专注于博
2017-10-25 14:25:26 1764
转载 数据结构图文解析之:AVL树详解及C++模板实现
AVL树简介AVL树的名字来源于它的发明作者G.M. Adelson-Velsky 和 E.M. Landis。AVL树是最先发明的自平衡二叉查找树(Self-Balancing Binary Search Tree,简称平衡二叉树)。一棵AVL树有如下必要条件:条件一:它必须是二叉查找树。条件二:每个节点的左子树和右子树的高度差至多为1。图一中左边二叉树的节点45的左孩子46比45大,不满足
2017-10-24 22:06:32 1064
原创 Machine Learning Stanford (week 1)
Model RepresentationTo establish notation for future use, we’ll use x(i) to denote the “input” variables (living area in this example), also called input features, and y(i) to denote the “output” or ta
2017-10-22 18:49:51 1061 5
原创 python之正则及应用
测试正则表达式的一个重要网站下图展示了使用正则表达式进行匹配的流程: 正则表达式的大致匹配过程是:依次拿出表达式和文本中的字符比较,如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败。如果表达式中有量词或边界,这个过程会稍微有一些不同,但也是很好理解的,看下图中的示例以及自己多使用几次就能明白。1.2. 数量词的贪婪模式与非贪婪模式正则表达式通常用于在文本中查找匹配的字符串。P
2017-10-19 22:58:22 1251
原创 Python之异步IO( asyncio) 协程
项目中用到了,看了还是知道了点皮毛,整理如下:python asyncio网络模型有很多中,为了实现高并发也有很多方案,多线程,多进程。无论多线程和多进程,IO的调度更多取决于系统,而协程的方式,调度来自用户,用户可以在函数中yield一个状态。使用协程可以实现高效的并发任务。Python的在3.4中引入了协程的概念,可是这个还是以生成器对象为基础,3.5则确定了协程的语法。下面将简单介绍async
2017-10-18 18:14:59 933
原创 python轻量级前端Flask
做代理池用到的一个Flask,他是一個使用Python编写的轻量级Web应用框架,刚刚入坑,在这存个官方链接 前言 请在使用 Flask 前阅读。希望本文能回答你一些关于 Flask 的用途和目标以及 Flask 适用情境的问题。“微” 是什么意思? “微”(micro) 并不表示你需要把整个 Web 应用塞进单个 Python 文件(虽然确实可以 ),也不意味着 Flask 在功能上有所欠缺
2017-10-18 10:55:38 1515
原创 python 进阶之属性函数property
Python中有一个被称为属性函数(property)的小概念,它可以做一些有用的事情。在这篇文章中,我们将看到如何能做以下几点:将类方法转换为只读属性 重新实现一个属性的setter和getter方法 在本文中,您将学习如何以几种不同的方式来使用内置的属性函数。希望读到文章的末尾时,你能看到它是多么有用。开始使用属性函数的最简单的方法之一是将它作为一个方法的装饰器来使用。这可以让你将一个类方法
2017-10-18 09:57:20 630
原创 fake-useragent User Agent 伪装
前几天意外找到一个简单实用的库- fake-useragent,可以伪装生成headers请求头中的User Agent值。安装pip3 install fake-useragent各浏览器的user-agent值from fake_useragent import UserAgentua = UserAgent()ie浏览器的user agentprint(ua.ie)Mozilla/5.0
2017-10-18 09:44:41 3209
原创 Classes as objects(元类)
Python确实是我接触过的最高深的一门语言,其实我接触的语言还是挺多的(假装很多。。。),但是像Python这样一个底层的语法让我研究一晚上的还正是没遇到过,对,我搞这个东西用了一个晚上!!! 官方文档太枯燥了。。。 首先这个metaclass是在师兄的代码里面看到的,感觉好强大的样子,然后各种查,终于在Stack Overflow上发现了一个大神,随后又找到了相应的译文,不过我还是尝试着全程
2017-10-15 23:39:09 563
原创 python 之_、__、__xxx__
本文为译文,版权属于原作者,在此翻译为中文分享给大家。英文原文地址:Difference between , _ and xx in Python“_”单下划线Python中不存在真正的私有方法。为了实现类似于c + +中私有方法,可以在类的方法或属性前加一个“_”单下划线,意味着该方法或属性不应该去调用,它并不属于API。在使用property时,经常出现这个问题:class BaseForm(S
2017-10-15 14:39:37 2335
原创 淘宝爬虫(Selenium)
相关介绍淘宝的整个页面数据确实也是通过Ajax获取的,但是这些 Ajax 接口参数比较复杂,可能会包含加密密钥等参数,所以我们如果想自己构造 Ajax 参数是比较困难的,对于这种页面我们最方便快捷的抓取方法就是通过 Selenium,本节我们就来用 Selenium 来模拟浏览器操作,抓取淘宝的商品信息,并将结果保存到 MongoDB。目标本节我们要利用 Selenium 抓取淘宝商品并用 PyQu
2017-10-14 16:17:17 778
原创 python之Selenium
Selenium 是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击、下 拉等等操作,同时还可以获取浏览器当前呈现的页面的源代码,做到可见即可爬。对于一些 JavaScript 动态渲染的页面来说,此种抓取方式非常有效 Selenium 是什么?一句话,自动化测试工具。它支持各种浏览器,包括 Chrome,Safari,Firefox 等主流界面式浏览器,如果你在这些浏览器里
2017-10-14 16:08:01 559
原创 Python常用集锦(upgrading...)
1、去除字符串首尾空格、回车、 tablestrip() ” xyz “.strip() # returns “xyz” ” xyz “.lstrip() # returns “xyz ” ” xyz “.rstrip() # returns ” xyz” ” x y
2017-10-13 17:45:15 664
原创 豆瓣爬虫
工具: Python、scrapy、Mongodb背景: 已经在Mongodb里面store了带爬取的链接,需要完善的是对链接字段添加并更新到数据库字段: 简介 introduction 主演 actors 导演 director 编剧 screenwriter 国家 country 上映日期 date 上映国家 语言 language 片长 durat
2017-10-13 15:09:13 1519
原创 scrapy代理
网上有好多proxy代理,下面的中间件完成scrapy的代理的爬虫demo github链接class ProxyMiddleware(): def __init__(self, proxy_url): self.logger = logging.getLogger(__name__) self.proxy_url = proxy_url def get
2017-10-12 10:46:48 727 2
原创 scrapy 概述
用了一段时间的scrapy了,比直接Requests、Urllib确实是好用很多,框架还是不错的,偶然看到这篇帖子,确实是深有体会,copy下作为记录在编程语言的世界里,python似乎被贴上了做爬虫的一个标签,强而有力。而scrapy做为另一个老牌的开源项目,更是大规模抓取不可或缺的一个重要力量。纵使scrapy依旧有一些长期无法解决的诟病,但是他在抓取过程帮程序员解决的一系列的细节问题,还是有无
2017-10-12 10:37:28 957
原创 scrapy提取不在标签内文字
response.xpath(u’//span[./text()=”出版社:”]/following::text()[1]’)如果text() 中有空格, 感谢 @董成良 提醒, 你可能还需要这么写response.xpath(u’//span[contains(./text(), “出版社:”)]/following::text()[1]’)或者全匹配:response.xpath(u’//sp
2017-10-12 10:09:18 2319
原创 Python官方文档(入门必备)
The Python Standard Library this library reference manual describes the standard library that is distributed with Python. It also describes some of the optional components that are commonly included in
2017-10-12 10:02:20 10384
转载 Python的hasattr() getattr() setattr() 函数使用方法详解
Python的hasattr() getattr() setattr() 函数使用方法详解hasattr(object, name)判断一个对象里面是否有name属性或者name方法,返回BOOL值,有name特性返回True, 否则返回False。 需要注意的是name要用括号括起来 1 >>> class test(): 2 ... name="xiaohua" 3 ...
2017-10-11 14:47:58 661
Redis-x64-3.2.100.msi
2017-10-14
坦克大战游戏,支持声音,配置等
2015-03-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人