自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 资源 (3)
  • 收藏
  • 关注

原创 如何学习

适合你的学习方式#你需要将学习时间和消遣的时间分开,如此你才能以较高的效率完成任务。#你在学习的时间一定要专注,不能够分心。#一个人精力集中的时间可能很短,最初你可以把学习时间设置在半个小时左右,然后逐步加长。#be optimistic#for love

2016-07-20 22:05:47 237

原创 golang 变量作用域

目录局部变量全局变量参数变量局部变量定义:在函数或者在语义块(if/for等)中定义的变量生效范围:定义在函数里面则在整个函数范围有效; 定义在语义块,则在整个语义块生效实例:// str定义在函数内,是一个局部变量,仅在Test函数内有效func Test(){ str := "This is a local var"}// str1定义在语义块 for 里面,是一...

2020-03-04 18:01:10 833

原创 解决wsl无法同步本地代理的dns信息

问题本地开了公司的vpn,使用vscode的remote wsl插件连接wsl1,结果wsl里面无法解析公司内部的一些域名,查了下发现原来是wsl无法自动同步本地vpn的dns信息。wsl2没有这个问题,又是wsl1的坑。解决方法基本是通过一些脚本把windows里的dns信息copy到wsl中,如:dnsfix () { /mnt/c/Windows/system32/ipconfig...

2020-02-11 11:30:08 4161 2

原创 VSCode Remote WSL: unable to rename folder (rename xxx permission denied)

问题使用vscode remote wsl安装go tools,报类似rename xxx permission denied的错误。检索发现时wsl1的问题,具体可见remote wsl不能重命名文件夹。解决方法参见官方给出的方法:原链接:i-see-eaccess-permission-denied-error-trying-to-rename-a-folder-in-the-op...

2020-02-10 13:55:53 1935

原创 Go安装第三方库时的网络问题解决

问题简述由于防火墙的存在,在使用golang下载第三方包时经常会遇到网络问题而下载失败。如在golang.org网站下的包,大多数都无法安装。解决方法使用代理 (http_proxy=xxxx)手动去github中搜索相应的包,clone至$GOPATH/src下,然后执行go get(优先从本地下载找)或者直接go install即可。...

2020-01-13 15:14:02 6242

转载 神经网络浅讲:从神经元到深度学习

原文:http://www.cnblogs.com/subconscious/p/5058741.html 神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向--深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助你理解深度学习技术。  本文以一种简单的,循序的方式讲解神经网络。适合对神经网络了解不多的同学。本文对阅读...

2019-03-05 20:36:51 523

转载 python selenium库爬虫介绍

原文链接:python爬虫从入门到放弃(八)之 Selenium库的使用。一、什么是Seleniumselenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Selenium Remote Control)和测试的并行处理(Selenium Grid)。Selenium的核心Selenium Core基于JsUnit,完全由JavaSc...

2018-12-03 12:49:00 493

原创 sql中的case函数

用法

2018-09-19 16:18:29 2554

原创 vim快捷键速览

出处见脚注,如有侵权请联系博主予以删除。

2018-08-28 15:58:57 201

原创 git忽略版本库中的文件——.gitignore

背景有些时候,工作目录中的一些文件没有必要提交到版本库中,如ide生成元数据文件、程序运行的数据、密码配置文件等等。 为了解决这个问题,可以在git工作区的根目录下创建一个特殊的.gitignore文件,将要忽略的文件写进去,git就会忽略对这些文件的版本控制。...

2018-08-02 12:56:06 550

原创 自动登录linux服务器脚本

背景在服务器上进行开发时,往往需要进行密码登录,甚至有的需要先登录堡垒机,再登录开发机,输入过程较为繁琐,因此考虑将命令写成脚本的形式自动化登录。方法ssh登录是一个交互的过程,且没有特定的参数指定密码的输入方式,因而不能用管道、重定向的方式实现。这种情况可以使用expect包进行自动登录功能的实现。 expect是一个用来处理与程序交互的包,适用于做ssh自动登录。可以使用wher...

2018-06-27 11:42:40 2950

原创 python安装第三方库提示cc1plus: warning: command line option “-Wstrict-prototypes” is valid for C/ObjC ....

py2安装pyltp的时候一直卡着不动,使用-v参数查看安装过程,发现一直提示:cc1plus: warning: command line option “-Wstrict-prototypes” is valid for Ada/C/ObjC but not for C++。py3安装pyltp的时候并不会提示这个错误。用搜索引擎查看了一下这个错误,似乎是一个python的bug,这个参数可以...

2018-04-09 12:11:40 26580 4

原创 linux下Found a swap file by the name解决

vim编辑文件时提示 Found a swap file by the name …….swp文件是在vi编辑文件时产生的一个临时文件,在编辑过程中过一段时间自动保存一次。如果意外退出,比如在vi编辑文件过程中退出系统(意外关机、直接关闭了Shell终端等情况),该文件就会存在,下次打开上次编辑的文件时就会出现提示。.swp文件使用ls命令查看不能发现,使用ls -a命令查看可以知道这是一个隐藏...

2018-03-31 15:26:50 45602 2

原创 linux 目录结构索引

/: root /bin: user binaries 用户的二进制可执行文件常见的linux命令,ps; ls; ping; grep; cp;/boot: boot loader files 引导加载程序相关文件内核的initrd、vmlinux/dev: device files 设备文件终端设备,usb或链接到系统的任何设备/etc: configuration file

2018-03-31 11:46:29 1016

原创 python运算符优先级

以下运算符优先级顺序依次递增:Lambda #运算优先级最低逻辑运算符: or逻辑运算符: and逻辑运算符:not成员测试: in, not in同一性测试: is, is not比较: <,<=,>,>=,!=,==按位或: |按位异或: ^按位与: &移位: << ,>>加法与减法: + ,-乘法、除法与取余:...

2018-03-09 12:00:23 1724

原创 python单元测试

概述单元测试是用来对一个模块、一个函数或者一个类来进行正确性检验的测试工作。 类似的概念还有QA测试,二者存在着一些区别,具体如下: QA测试 单元测试 时间 开发后 开发中、开发前(测试驱动开发) 对象 模块、(子)系统 函数、类 方式 手动or自动 自动 测试目的 功能、异常、性能、压力 算法、逻辑单元测试的意义: - 提升代码覆

2017-12-25 16:16:10 512

原创 git——分支管理

简介在版本回退中,代码仓库被串成了一条时间线,这条线被称作为主分支(master)。我们也可以创建其他分支,以实现同步开发。分支管理的相关命令查看分支:git branch创建分支:git branch [name]切换分支:git checkout [name]创建+切换分支:git checkout -b [name]合并某分支到当前分支:git merge [name]删除分支:git bra

2017-12-22 22:21:54 226

原创 python内部装饰器@classmethod, @staticmethod, @property

python面向对象编程中经常会用到三个装饰器语法:@classmethod, @staticmethod, @property。因为之前学习了下装饰器,所以在此了解一下python内置的三个装饰器。@staticmethod和@classmethod面向对象中类的方法一般有实例方法和静态方法两种,实例方法的调用需要先创建类的实例对象,而静态方法可以直接可以通过类名来调用。在python中使用@st

2017-12-06 20:47:08 1987

原创 python装饰器

一、概述python中可以看到@statement的语法,它通常出现在函数定义或类定义的前面一行。这就是python装饰器,用于在不做代码变动的情况下增强函数或类的功能。装饰器可以提取大量函数中与本身功能无关的类似代码,从而达到代码重用的目的。它有着很多经典使用场景,例如插入日志、性能测试、事务处理等等。二、语法装饰器的一般的语法如下:#声明两个装饰器f1、f2def f1(arg): d

2017-11-24 21:32:08 304

原创 斯坦福自然语言处理工具python环境配置

斯坦福自然语言处理工具python环境配置1. 简介Stanford nlp group 是世界知名的自然语言处理研究组,该组的研究内容涵盖了从基本的计算语言原理研究到NLP的关键应用技术。其中,该组所开发的coreNLP工具被广泛应用,该工具提供了分词、词性标注、语法分析、共指消解、命名实体识别等操作。Stanford coreNLP源码使用Java编写而成,但一些程序员将coreNLP进行了封装

2017-10-28 00:46:03 1330

原创 python3 pandas读写excel

0. 前言Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具,能使我们快速便捷地处理数据。本文介绍如何用pandas读写excel。1. 读取excel读取excel主要通过read_excel函数实现,除了pandas还需

2017-08-08 14:47:27 92057 2

原创 LSI(LSA)潜在语义索引原理及sklearn中的实现

想要了解潜在语义索引的原理推荐以下三个链接,仔细看下就能基本掌握LSI的原理:1.文本主题模型之潜在语义索引(LSI)2.奇异值分解(SVD)原理与在降维中的应用3.latent semantic analysis via the singular value decompositionLSI的核心在于svd,在sklearn中提供了svd的实现。具体接口如下:sklearn.

2017-07-28 11:24:18 3348

原创 python中的序列化

       0.索引        1.json序列化变量       2.numpy序列化ndarray       3.pickle序列化变量        序列化 (Serialization)是指将对象、数据结构的状态信息转换为可以存储或传输的形式的过程。在序列化期间,对象将其当前状态写入到临时或持久性存储区。以后,可以通过从存储区中读取或反序列化对象的状态,重新创建...

2017-07-07 23:49:54 7166 1

转载 集成学习(ensemble methods)概述

集成学习(ensemble learning)可以说是现在非常火爆的机器学习方法了。它本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集成学习可以用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等,可以说所有的机器学习领域都可以看到集成学习的身影。本文就对集成学习的原理做一个总结。1. 集成学习概述  从下图,我们可以对集...

2017-06-29 20:50:38 1733

转载 html,css,js加载顺序

1.js放在head中会立即执行,阻塞后续的资源下载与执行。因为js有可能会修改dom,如果不阻塞后续的资源下载,dom的操作顺序不可控。  正常的网页加载流程是这样的。浏览器一边下载HTML网页,一边开始解析解析过程中,发现标签暂停解析,网页渲染的控制权转交给JavaScript引擎如果标签引用了外部脚本,就下载该脚本,否则就直接执行执行完毕,控制权交还渲染引擎,恢复往下解析HT

2017-06-01 00:13:55 892

原创 查看mysql数据库、数据表编码信息

通过MySQL的命令行即可以查看数据库、数据表的编码信息。1.查看数据库编码格式show variables like 'character_set_database';2.查看数据表的编码格式show create table ;

2017-04-20 18:42:50 8928

原创 sql语句执行顺序

查询中用到的关键词主要包含六个:select--from--where--group by--having--order by

2017-03-14 18:09:51 320

原创 python中的json模块介绍

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,其最广泛的应用是作为AJAX中web服务器和客户端的通讯的数据格式。json类似于xml,但比 XML 更小、更快,更易解析。简单来讲,json的格式与python种的字典和列表及其二者的组合类似。如下面的一个json格式的数据(引自百度百科):{ "programmers": [{

2017-02-08 20:26:58 3011

原创 字符编码相关概念理解

写在前面。字符编码是一个让人头疼的问题,让问题显得混淆的原因不止在于编码本身的多样性和发展变化,更在于人们对于其中所涉及的术语概念的滥用。本文所提到的术语概念是在查阅相关资料以及文献汇总得到的,注重于对编码所涉及的问题的梳理。一、基本概念字符集:一个国家或地区,或者某种语言文字中所使用的所有符号的集合。如中国字符集指的就是“汉字”和标点。字符编码:一个从字符集到一个非负整数集合直接的一

2016-12-14 10:57:55 422

原创 python爬虫解决网页重定向问题

笔者使用python2.7+requests编写爬虫,以下问题针对此情况讨论。重定向(Redirect)就是通过各种方法(本文提到的为3种)将各种网络请求重新定个方向转到其它位置(URL),编写的搜索引擎爬虫在爬取页面时遇到了网页被重定向的情况。当重定向发生在某个网站的主页时,作为该网站的入口,如果不能正确处理重定向很有可能会错失这整个网站的内容。笔者编写的爬虫在爬取网页时遇到了三种重定向

2016-12-12 22:04:21 36664 5

原创 使用lxml去除html中的tag得到纯文本

主要使用lxml.html.document_fromstring()实现。

2016-12-11 18:58:56 2379

原创 python内置模块urlparse解析url

写检索作业的时候遇到了操作url的问题,发现urlparse内置模块提供了一些帮助。

2016-12-11 18:56:46 1591

原创 多线程间变量的共享

写python程序的时候遇到了共享变量的问题,在网上看到了一篇讲java多线程变量共享的文章,有共通之处,整理下发在这里吧。方法体内部定义的局部变量不共享,这是因为方法内部定义的变量是在运行时动态生成的。每个线程都有一个自己的堆栈,用于保存运行时的数据。 最容易理解的就是递归调用时候,每次的入栈出栈操作。如下,每次调用时,变量a都是在运行时堆栈上保存的,方法结束变量也就释放了。

2016-10-28 21:28:29 3708

原创 IO密集型vs计算密集型

经常听到别人说python多线程针对io密集型任务可以提升效率,而针对计算密集型则没有什么效果,那么什么是IO密集型和计算密集型呢?任务类型可以分为计算密集型和IO密集型。计算密集型任务的特点是要进行大量的计算,消耗CPU资源,比如计算圆周率、对视频进行高清解码等等,全靠CPU的运算能力。这种计算密集型任务虽然也可以用多任务完成,但是任务越多,花在任务切换的时间就越多,CPU执行任务的效率

2016-10-27 18:25:53 1563

原创 python变量作用域

变量作用域(scope)在Python中是一个容易掉坑的地方。什么是作用域作用域简单说就是一个变量的命名空间。代码中变量被赋值的位置,就决定了哪些范围的对象可以访问这个变量,这个范围就是命名空间。python赋值时生成了变量名,当然作用域也包括在内。Python的作用域一共有4中,分别是:L (Local) 局部作用域E (Enclosing) 闭包函数外的函数中G (

2016-10-26 14:11:13 276

原创 python拷贝对象

在python中复制变量时应当注意,Python中的对象之间赋值时是按引用传递的,如果需要拷贝对象,需要使用标准库中的copy模块。 1. copy.copy 浅拷贝 只拷贝父对象,不会拷贝对象的内部的子对象。 2. copy.deepcopy 深拷贝 拷贝对象及其子对象 import copy a = [1, 2, 3, 4, ['a', 'b']] #原始对象 b = a #赋值

2016-10-15 19:12:40 429

原创 python多线程-threading模块

threading通过对thread模块进行二次封装,提供了更方便的API来操作线程。

2016-10-14 19:49:11 330

原创 python函数参数介绍

python中自定义函数的参数主要分为4种,分别为必选参数、默认参数、可变参数和关键字参数。必选参数:常用的一种参数,调用函数时必须传递该参数def func(x): print x默认参数:调用函数时可以不传递该参数,此时函数将该参数设置为默认值def func(x=1): print x#如果x没有传入值,则打印1可变参数:定义时参数前面加*,则该

2016-09-27 13:17:33 306

原创 python提交表单时属性名重复问题的解决

写爬虫时会遇到提交表单的问题,一般先构造data,然后利用post方式进行提交表单。一般data的数据类型为字典,但当遇到多个数据项的属性名字重复时,则不能够使用字典了,因为字典中的键是不能够重复的。对于这个问题的解决可以使用,列表+元组的形式进行data数据的构造。如下:data=[('data_name','value'),('data_name','value'),('data_name

2016-09-25 14:37:13 748

原创 python三行实现快排

# Quick Sort in 3 linesdef qsort(L): if len(L) <= 1: return L return qsort([lt for lt in L[1:] if lt = L[0]])

2016-08-10 14:39:52 1015

python-redis参考手册

python操作redis数据库的第三方模块python-redis的中文参考手册。

2016-12-15

Python2.7文档

Python2.7参考文档,适合查阅的chm版

2015-11-02

scrapy0.2.4文档html版

HTML版本的scrapy文档,适合参考用~

2015-11-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除