自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI蜗牛之家

北航烟酒僧~ 腾讯自然语言处理算法工程师~

  • 博客(26)
  • 资源 (4)
  • 收藏
  • 关注

原创 matlab 函数笔记

1. 特殊变量与常数 主题词 意义 主题词 意义 ans 计算结果的变量名 computer 确定运行的计算机 eps 浮点相对精度 Inf 无穷大 I 虚数单位 inputname 输入参数名 NaN 非数 nargin 输入参数个数 nargout 输出参数的数目 pi 圆周率 nargoutchk

2017-10-29 12:56:45 808

原创 线性回归之特征归一化、步长选择、特征组合

针对ng上的线性回归课程,几个技巧性的方法,现整理如下: 在求解线性回归的模型时,有三个需要注意的问题一就是特征组合问题,比如房子的长和宽作为两个特征参与模型的构造,不如把其相乘得到面积然后作为一个特征来进行求解,这样在特征选择上就做了减少维度的工作。这个是多项式回归(Polynomial Regression)里面的一个重点问题。二就是特征归一化(Feature Scaling),这也是许多机器

2017-10-27 23:29:19 3957

原创 Machine Learning Stanford (week 2)

1. Multivariate Linear Regression1.1 Multiple FeaturesNote: [7:25 - θT is a 1 by (n+1) matrix and not an (n+1) by 1 matrix] Linear regression with multiple variables is also known as “multivariate lin

2017-10-27 22:30:49 818

转载 Markdown之列表&MathJax

下面说的Markdown的表格形式已经被用烂了,但是一直不怎么用Markdown里面的MathJax,实在不行就小窗截图,随着这个审美的不断提升,现在看那个实在是越来越丑啊,下面贴下转载的帖子,好好学习下。1. 前言Markdown是一种轻量级的标记语言,把作者从繁杂的排版工作中解放出来,实现易读易写的文章写作,已经逐渐成为事实上的行业标准。CSDN博客支持Markdown可以让广大博友更加专注于博

2017-10-25 14:25:26 1764

转载 数据结构图文解析之:AVL树详解及C++模板实现

AVL树简介AVL树的名字来源于它的发明作者G.M. Adelson-Velsky 和 E.M. Landis。AVL树是最先发明的自平衡二叉查找树(Self-Balancing Binary Search Tree,简称平衡二叉树)。一棵AVL树有如下必要条件:条件一:它必须是二叉查找树。条件二:每个节点的左子树和右子树的高度差至多为1。图一中左边二叉树的节点45的左孩子46比45大,不满足

2017-10-24 22:06:32 1064

原创 Machine Learning Stanford (week 1)

Model RepresentationTo establish notation for future use, we’ll use x(i) to denote the “input” variables (living area in this example), also called input features, and y(i) to denote the “output” or ta

2017-10-22 18:49:51 1061 5

原创 python之正则及应用

测试正则表达式的一个重要网站下图展示了使用正则表达式进行匹配的流程: 正则表达式的大致匹配过程是:依次拿出表达式和文本中的字符比较,如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败。如果表达式中有量词或边界,这个过程会稍微有一些不同,但也是很好理解的,看下图中的示例以及自己多使用几次就能明白。1.2. 数量词的贪婪模式与非贪婪模式正则表达式通常用于在文本中查找匹配的字符串。P

2017-10-19 22:58:22 1251

原创 Python之异步IO( asyncio) 协程

项目中用到了,看了还是知道了点皮毛,整理如下:python asyncio网络模型有很多中,为了实现高并发也有很多方案,多线程,多进程。无论多线程和多进程,IO的调度更多取决于系统,而协程的方式,调度来自用户,用户可以在函数中yield一个状态。使用协程可以实现高效的并发任务。Python的在3.4中引入了协程的概念,可是这个还是以生成器对象为基础,3.5则确定了协程的语法。下面将简单介绍async

2017-10-18 18:14:59 933

原创 Redis官方文档(入门必备)

函数大全中文文档官方文档

2017-10-18 12:43:43 7110

原创 python轻量级前端Flask

做代理池用到的一个Flask,他是一個使用Python编写的轻量级Web应用框架,刚刚入坑,在这存个官方链接 前言 请在使用 Flask 前阅读。希望本文能回答你一些关于 Flask 的用途和目标以及 Flask 适用情境的问题。“微” 是什么意思? “微”(micro) 并不表示你需要把整个 Web 应用塞进单个 Python 文件(虽然确实可以 ),也不意味着 Flask 在功能上有所欠缺

2017-10-18 10:55:38 1515

原创 python 进阶之属性函数property

Python中有一个被称为属性函数(property)的小概念,它可以做一些有用的事情。在这篇文章中,我们将看到如何能做以下几点:将类方法转换为只读属性 重新实现一个属性的setter和getter方法 在本文中,您将学习如何以几种不同的方式来使用内置的属性函数。希望读到文章的末尾时,你能看到它是多么有用。开始使用属性函数的最简单的方法之一是将它作为一个方法的装饰器来使用。这可以让你将一个类方法

2017-10-18 09:57:20 630

原创 fake-useragent User Agent 伪装

前几天意外找到一个简单实用的库- fake-useragent,可以伪装生成headers请求头中的User Agent值。安装pip3 install fake-useragent各浏览器的user-agent值from fake_useragent import UserAgentua = UserAgent()ie浏览器的user agentprint(ua.ie)Mozilla/5.0

2017-10-18 09:44:41 3209

原创 python问题相关译文

我的GitHub地址:translations_abou_python

2017-10-16 00:58:54 498

原创 Classes as objects(元类)

Python确实是我接触过的最高深的一门语言,其实我接触的语言还是挺多的(假装很多。。。),但是像Python这样一个底层的语法让我研究一晚上的还正是没遇到过,对,我搞这个东西用了一个晚上!!! 官方文档太枯燥了。。。 首先这个metaclass是在师兄的代码里面看到的,感觉好强大的样子,然后各种查,终于在Stack Overflow上发现了一个大神,随后又找到了相应的译文,不过我还是尝试着全程

2017-10-15 23:39:09 563

原创 python 之_、__、__xxx__

本文为译文,版权属于原作者,在此翻译为中文分享给大家。英文原文地址:Difference between , _ and xx in Python“_”单下划线Python中不存在真正的私有方法。为了实现类似于c + +中私有方法,可以在类的方法或属性前加一个“_”单下划线,意味着该方法或属性不应该去调用,它并不属于API。在使用property时,经常出现这个问题:class BaseForm(S

2017-10-15 14:39:37 2335

原创 淘宝爬虫(Selenium)

相关介绍淘宝的整个页面数据确实也是通过Ajax获取的,但是这些 Ajax 接口参数比较复杂,可能会包含加密密钥等参数,所以我们如果想自己构造 Ajax 参数是比较困难的,对于这种页面我们最方便快捷的抓取方法就是通过 Selenium,本节我们就来用 Selenium 来模拟浏览器操作,抓取淘宝的商品信息,并将结果保存到 MongoDB。目标本节我们要利用 Selenium 抓取淘宝商品并用 PyQu

2017-10-14 16:17:17 778

原创 python之Selenium

Selenium 是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击、下 拉等等操作,同时还可以获取浏览器当前呈现的页面的源代码,做到可见即可爬。对于一些 JavaScript 动态渲染的页面来说,此种抓取方式非常有效 Selenium 是什么?一句话,自动化测试工具。它支持各种浏览器,包括 Chrome,Safari,Firefox 等主流界面式浏览器,如果你在这些浏览器里

2017-10-14 16:08:01 559

原创 Python常用集锦(upgrading...)

1、去除字符串首尾空格、回车、 tablestrip() ” xyz “.strip() # returns “xyz” ” xyz “.lstrip() # returns “xyz ” ” xyz “.rstrip() # returns ” xyz” ” x y

2017-10-13 17:45:15 664

原创 豆瓣爬虫

工具: Python、scrapy、Mongodb背景: 已经在Mongodb里面store了带爬取的链接,需要完善的是对链接字段添加并更新到数据库字段: 简介 introduction 主演 actors 导演 director 编剧 screenwriter 国家 country 上映日期 date 上映国家 语言 language 片长 durat

2017-10-13 15:09:13 1519

原创 scrapy代理

网上有好多proxy代理,下面的中间件完成scrapy的代理的爬虫demo github链接class ProxyMiddleware(): def __init__(self, proxy_url): self.logger = logging.getLogger(__name__) self.proxy_url = proxy_url def get

2017-10-12 10:46:48 727 2

原创 scrapy 概述

用了一段时间的scrapy了,比直接Requests、Urllib确实是好用很多,框架还是不错的,偶然看到这篇帖子,确实是深有体会,copy下作为记录在编程语言的世界里,python似乎被贴上了做爬虫的一个标签,强而有力。而scrapy做为另一个老牌的开源项目,更是大规模抓取不可或缺的一个重要力量。纵使scrapy依旧有一些长期无法解决的诟病,但是他在抓取过程帮程序员解决的一系列的细节问题,还是有无

2017-10-12 10:37:28 957

原创 scrapy提取不在标签内文字

response.xpath(u’//span[./text()=”出版社:”]/following::text()[1]’)如果text() 中有空格, 感谢 @董成良 提醒, 你可能还需要这么写response.xpath(u’//span[contains(./text(), “出版社:”)]/following::text()[1]’)或者全匹配:response.xpath(u’//sp

2017-10-12 10:09:18 2319

原创 Mongodb官方文档(入门必备)

MongoDB 3.4 Manual W3School MangoDB教程 MongoDB 教程

2017-10-12 10:03:17 6587

原创 Python官方文档(入门必备)

The Python Standard Library this library reference manual describes the standard library that is distributed with Python. It also describes some of the optional components that are commonly included in

2017-10-12 10:02:20 10384

原创 scrapy 官方文档(入门必备)

scrapy(官方) scrapy(中文)

2017-10-12 10:01:27 9391

转载 Python的hasattr() getattr() setattr() 函数使用方法详解

Python的hasattr() getattr() setattr() 函数使用方法详解hasattr(object, name)判断一个对象里面是否有name属性或者name方法,返回BOOL值,有name特性返回True, 否则返回False。 需要注意的是name要用括号括起来 1 >>> class test(): 2 ... name="xiaohua" 3 ...

2017-10-11 14:47:58 661

Redis-x64-3.2.100.msi

Redis-x64-3.2.100.msi,因为官网的速度实在是太低了,所以下载下来共享,不过现在最低需要2积分,没法免费了,是在抱歉,若需要留言也可

2017-10-14

STL整理总结

C++的基本库函数STL

2017-04-24

坦克大战游戏,支持声音,配置等

自己写的坦克大战,包括声音等特效,能够对游戏进行坦克数目、地图等进行设置,代码大约1200-1300行,可在此基础上进行深度开发,是对初学者并有部分Java基础的一个很好的锻炼机会,代码由本人自主开发,较为实用。当然也可以作为大作业使用

2015-03-14

C++ API

包含C++以及C语言的库函数,在学习和使用时便于查找和理解库函数

2015-01-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除