自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(11)
  • 资源 (1)
  • 收藏
  • 关注

原创 Python多线程与多进程

在python里多线程和多进程的用法基本相同,但实现方式是不同的,多线程是伪多线程,多进程就是实实在在的多进程,在任务管理器中可以看到有多个python的多个进程在运行。python的伪多线程可以提高IO,而比如一个线程在等待传输数据,一个线程在处理数据或者持久化。而多进程可以在不同的任务中,并行的去处理。线程与进程都可以通过锁,队列等实现同步和通信。光说不练假把式,下面举个列子:使用

2016-03-15 15:23:52 324

原创 CentOS下安装JAVA SDK,Eclipse,MyEclipse,Android Studio

Centos下安装JDK,Eclipse,MyEclipse和Android Studio

2015-08-31 21:17:20 1074

原创 案例页面的自动生成之:使用AutoCreatePage extension实现

使用插件:(在下载的压缩包内有安装方法)AutoCreatePage [1]CreatePage准备步骤:打开Semantic Froms 下的 Creat a ClassTemplate Name 是模版的名称,Form Name是创建的表单名称,也就是后面要直接用到的,Category Name是用Form所创建的模版的页面所属的类别,在此可以统一填上Casefield n

2015-08-12 21:41:56 355 1

原创 MediaWiki的SemanticForms插件使用方法

SemanticFormsSemanticForms是MediaWiki的extension,SemanticMediaWiki为支撑的extension,它可以帮助用户快速、简便的生成一定格式的表格,infobox等,提供以表格形式编辑,记录页面信息,搜索等功能。SemanticForms在页面中的使用方式灵活,可以配合部分HTML的标签功能实现在页面中的排版,如div span等。

2015-08-12 21:40:08 826

原创 在WAMPSERVER下安装MediaWiki及其插件SemanticMediaWiki和SemanticForms

WAMPSERVER是一个优秀的集成PHP + apache + MySql环境一:安装MySql  ,最好是5.5.0以上版本二:安装WampServer,Git,Composer1、安装WampServer2.1、在WampServer安装目录/bin/php/php5.3.10/php.ini文件中,去掉extension=php_openssl.dll前的分号;修改max_

2015-07-30 15:12:09 1482

原创 统计学与机器学习的区别

统计学与机器学习之间孰优孰劣在学术界也是个争论不休的话题,思考这个问题是源于今天老师突然问了我:在信息抽取领域中“基于统计的方法”和“基于机器学习的方法“有什么区别?一时语塞。。。花了不少时间去找资料,问同学,现在基本算是知道点了,其实两者的差别还是挺明显的,首先说一个“然并卵”的:统计学分类领域包含了对数据的收集和组织,然后,两者的最主要区别是数据生成的方式的区别:1、统

2015-07-20 21:51:13 1012

原创 Deep Learning

从这段时间打算开始好好学习ML和DL,首先比较完全的资料是必须的,用类似爬虫的思想去找资料,一点点收集~用这篇随时更新的文章来记录找到的资料,和自己的学习阅读进度,和自己对资料的点评,督促自己也方便大家。1、放在最前面的资料当然就是Andrew NG的讲课,这是自己在学校的PT上下载的,放在网盘上,地址:1.1  视频资料:这个版本比较简短:http://openclassro

2015-07-20 21:37:11 347

原创 修改后的HTML2TXT代码,及在C++下使用NLPIR系统进行分词

上次把HTML的内容提取了出来,但代码还有一些问题,今天上午进行了一些修改,并添加了注释,并上传GITHUB总结的时候可以整理自己学习到的东西,并理清思路。from bs4 import BeautifulSoupimport codecsimport osimport sys############################# 输入地址path,输出地址pathT

2015-05-26 15:15:23 330

原创 python 使用BeautifulSoup

from bs4 import BeautifulSoupimport codecsimport osimport syspath='E:\\BaiduYunDownload\\www.cworksafety.com'pathTxt='E:\\BaiduYunDownload\\www.cworksafety.com.Txt'if not os.path.exists(pathTxt

2015-05-22 21:01:22 230

转载 GitHub for Windows

同样是转载,在文章末尾已注明原文地址,留学习之用Git是一个分布式的版本控制系统,最初由Linus Torvalds编写,用作Linux内核代码的管理。作为一个程序员,我们需要掌握其用法。作为开源代码库以及版本控制系统,Github目前拥有140多万开发者用户。随着越来越多的应用程序转移到了云上,Github已经成为了管理软件开发以及发现已有代码的首选方法。其联合创始人

2015-05-14 16:10:14 313

转载 GitHub基本功能

GitHub的基本使用方法

2015-05-14 15:12:59 284

自己动手写网络爬虫

既然百度、Google 这些搜索引擎巨头已经帮我们抓取了互联网上的大部分信息,为什么还要自己写爬虫呢?因为深入整合信息的需求是广泛存在的。在企业中,爬虫抓取下来的信息可以作为数据仓库多维展现的数据源,也可以作为数据挖掘的来源。甚至有人为了炒股,专门抓取股票信息。既然从美国中情局到普通老百姓都需要,那还等什么,让我们快开始吧。

2014-09-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除