- 博客(24)
- 资源 (3)
- 收藏
- 关注
原创 工作需要学习的东西之 telnet
转自 百度百科 http://baike.baidu.com/link?url=wa9B6s4h1FVFnWbLhiE0rXXyHavf4golPNxi3AC4oUZw9sRmbAqgXdaT3LNzkSQ5hocEDJmMopvALp7Xnmbuy_telnet(远程控制服务器;c/s服务;可以用自己的计算机直接操纵远程计算机,享受远程计算机本地终端同样的操作权限。)Telnet
2016-07-26 17:15:19 1007
原创 Pandas DataFrames筛选数据
最近突然发现了pandas真实特别好用,实在需要好好学习下。貌似经过pd方法导入的数据都是DataFrame类型(二维)或者Series类型(一维)。今天在百度经验里看到了DataFrame的数据筛选,自己也尝试了下,顺便记录下来。1.先加载os包,打开一个csv文件,读出其中内容import osimport pandas as pd aqicsv = pd.read_csv("D:
2015-11-28 20:43:41 138980 2
转载 有关python中的pylab的下载安装
作为一个python新手,着实是一件不愉快的事情,因为连怎么安装python的包module都浪费了我2天的时间,我一直在咒骂python,连个 像样的像Perl一样的典藏网CPAN都没有,怎么还能混迹编程语言界这么久。不过,还是要学的呀,化悲痛为愤恨,我找到了星星之火。pylab 并不是我想的,它不是一个包,而是 numpy, scipy 和 matplotlab 的合体,三者相依为命,又各
2014-03-17 10:21:13 4276
转载 设置 Sublime Text 的 Python 开发环境
Sublime Text 的 Python 开发环境字体的选择Ubuntu Mono 是非常非常不错的字体。前些天我刚从 Menlo 切换过来,这绝对不让人后悔。在我的15寸的MacBook上,Ubuntu Mono的16号字非常适合。1680 × 1050的分辨率对于一个边栏加两个编辑器窗口(自动调整到80个字符宽)刚好合适。如果你打算认真的挑选一下字体, s
2014-01-13 16:56:21 1386
原创 javascript 浏览器类型判断
說明: navigator就是浏览器对象 navigator.appName: 浏览器的名称 indexOf(“Netscape“) 是返回浏览器名称字符串中“Netscape“的位置,如果找不到,则返回-1. navigator.appName.indexOf(“Netscape“)!=-1 就是判断句: “当前浏览器是Netscape“,如果当前浏览器是Ne
2013-12-28 10:57:01 917
转载 CSS里的各种水平垂直居中基础写法心得分享(附内联元素,块级元素的基本概念)
http://www.w3school.com.cn/htmldom/prop_style_verticalalign.asp(W3C标准,概念不清的看手册很重要哦) 首先,依旧是概念。介绍一下行内元素和块级元素,这个很重要,因为有的属性只能用于块元素,而有的正好相反,在一定的情况下,它们也可以相互转换,比如用display来进行设置。行内元素(又叫内联元素inline
2013-12-27 09:26:43 2646
转载 主题模型的分类和设计原则
topic model的介绍性文章已经很多,在此仅做粗略介绍,本文假设读者已经较为熟悉Topic Medel。Topic Model (LDA)认为一个离散数据集合(如文档集合,图片集合,为行文方便,本文统统以文档集合作为描述对象,其他的数据集合只需换掉对应的术语即可)是由隐含在数据集合背后的topic set 生成的,这个set中的每一个topic都是词的概率分布。对于文档中的每
2013-10-14 08:49:26 2957
转载 概率主题模型简介 Introduction to Probabilistic Topic Models
此文为David M. Blei所写的《Introduction to Probabilistic Topic Models》的译文,供大家参考。摘要:概率主题模型是一系列旨在发现隐藏在大规模文档中的主题结构的算法。本文首先回顾了这一领域的主要思想,接着调研了当前的研究水平,最后展望某些有所希望的方向。从最简单的主题模型——潜在狄立克雷分配(Latent Dirichlet Alloc
2013-10-12 09:29:55 958
转载 The Dirichlet Distribution 狄利克雷分布
Dirichlet分布可以看做是分布之上的分布。如何理解这句话,我们可以先举个例子:假设我们有一个骰子,其有六面,分别为{1,2,3,4,5,6}。现在我们做了10000次投掷的实验,得到的实验结果是六面分别出现了{2000,2000,2000,2000,1000,1000}次,如果用每一面出现的次数与试验总数的比值估计这个面出现的概率,则我们得到六面出现的概率,分别为{0.2,0.2,0.2,0
2013-10-12 09:00:07 4203
转载 LDA简介
上个学期到现在陆陆续续研究了一下主题模型(topic model)这个东东。何谓“主题”呢?望文生义就知道是什么意思了,就是诸如一篇文章、一段话、一个句子所表达的中心思想。不过从统计模型的角度来说, 我们是用一个特定的词频分布来刻画主题的,并认为一篇文章、一段话、一个句子是从一个概率模型中生成的。D. M. Blei在2003年(准确地说应该是2002年)提出的LDA(Latent D
2013-10-12 08:54:09 1399
原创 微博项目中的感想
最近在做有关新浪微博的数据挖掘,有一些感想,先记下来,免得忘记不要依赖eclipse的集成环境,要学会用tomcat服务器自己来写。主要过程:自己弄免安装的tomcat,把自己的电脑作为服务器,别人可以访问。就是客户端发请求给我的tomcat,然后我的tomcat通过servlet(本系统为textservlet.class)访问数据库,数据库返回数据给服务器,服务器将数据
2013-09-11 21:35:57 861
原创 mongodb报错:Mon Mar 25 10:41:10 Error: couldn't connect to server 127.0.0.1 shell/mongo.js:84
启动mongodb时遇到一个问题:MongoDB shell version: 2.0.6connecting to: testMon Mar 25 10:41:10 Error: couldn't connect to server 127.0.0.1 shell/mongo.js:84exception: connect failed
2013-09-04 15:12:44 933
转载 Mongodb在Windows下安装及配置
分类: NoSQL mongodb 数据库/sql2011-01-08 19:44 14413人阅读 评论(5) 收藏 举报mongodbwindows数据库cmdservicejavascript1.下载mongodb的windows版本,有32位和64位版本,根据系统情况下载,下载地址:http://www.mongodb.org/downloads2.解压缩至
2013-09-04 10:54:10 537
转载 无法启动mongoDB的如下问题 dbexit
删除mongod 启动时 -dbpath /data/db 集合 同一目录下产生的:_tmp和mongod.lock,重启mongodb即可解决问题(下次遇到可以尝试用一下)
2013-09-04 10:30:40 755
转载 8天学通MongoDB——第八天 驱动实践
作为系列的最后一篇,得要说说C#驱动对mongodb的操作,目前驱动有两种:官方驱动和samus驱动,不过我个人还是喜欢后者,因为提供了丰富的linq操作,相当方便。 官方驱动:https://github.com/mongodb/mongo-csharp-driver/downloads。下载后,还提供了一个酷似msdn的帮助文档。samus驱动:https://
2013-09-04 10:14:08 816
转载 8天学通MongoDB——第六天 分片技术
在mongodb里面存在另一种集群,就是分片技术,跟sql server的表分区类似,我们知道当数据量达到T级别的时候,我们的磁盘,内存就吃不消了,针对这样的场景我们该如何应对。 一:分片 mongodb采用将集合进行拆分,然后将拆分的数据均摊到几个片上的一种解决方案。 下面我对这张图解释一下: 人脸: 代
2013-09-04 10:12:01 765
转载 8天学通MongoDB——第七天 运维技术
这一篇我们以管理员的视角来看mongodb,作为一名管理员,我们经常接触到的主要有4个方面:1. 安装部署2. 状态监控3. 安全认证4. 备份和恢复,下面我们就一点一点的讲解。 一:安装部署 我之前的文章都是采用console程序来承载,不过在生产环境中这并不是最佳实践,谁也不愿意在机器重启后满地找牙似找mon
2013-09-04 10:11:57 736
转载 8天学通MongoDB——第五天 主从复制
从这一篇开始我们主要讨论mongodb的部署技术。 我们知道sql server能够做到读写分离,双机热备份和集群部署,当然mongodb也能做到,实际应用中我们不希望数据库采用单点部署,如果碰到数据库宕机或者被毁灭性破坏那是多么的糟糕。 一:主从复制1: 首先看看模型图 2: 从上面的图形中我们可以分析出这种架构有如下的好处
2013-09-04 10:10:21 827
转载 8天学通MongoDB——第四天 索引操作
这些天项目改版,时间比较紧,博客也就没跟得上,还望大家见谅。 好,今天分享下mongodb中关于索引的基本操作,我们日常做开发都避免不了要对程序进行性能优化,而程序的操作无非就是CURD,通常我们又会花费50%的时间在R上面,因为Read操作对用户来说是非常敏感的,处理不好就会被人唾弃,呵呵。 从算法上来说有5种经典的查找,具体的可以参见我的算法速成系列,这其中
2013-09-04 10:09:28 897
转载 8天学通MongoDB——第三天 细说高级操作
今天跟大家分享一下mongodb中比较好玩的知识,主要包括:聚合,游标。一: 聚合 常见的聚合操作跟sql server一样,有:count,distinct,group,mapReduce。 count count是最简单,最容易,也是最常用的聚合工具,它的使用跟我们C#里面的count使用简直一模一样。 dist
2013-09-04 10:08:50 683
转载 8天学通MongoDB——第二天 细说增删查改
看过上一篇,相信大家都会知道如何开启mongodb了,这篇就细说下其中的增删查改,首先当我们用上一篇同样的方式打开mongodb,突然傻眼了,擦,竟然开启不了,仔细观察“划线区域“的信息,发现db文件夹下有一个类似的”lock file”阻止了mongodb的开启,接下来我们要做的就是干掉它,之后,开启成功,关于mongodb的管理方式将在后续文章分享。 一
2013-09-04 10:07:22 825
转载 8天速成mongoDB(一)
第一天关于mongodb的好处,优点之类的这里就不说了,唯一要讲的一点就是mongodb中有三元素:数据库,集合,文档,其中“集合”就是对应关系数据库中的“表”,“文档”对应“行”。 一: 下载 上MongoDB官网 ,我们发现有32bit和64bit,这个就要看你系统了,不过这里有两点注意: ①:根据业界规则,偶数为“稳
2013-09-04 10:06:00 884
原创 mongodb启动出现 无法定位程序输入点 InterlockedCompareExchange64
在执行mongod.exe安装mongodb时 出现无法定位程序输入点 InterlockedCompareExchange64 于动态链接库KERNEL32.dll上解决方案:如果你遇到这样的错误,那么说明你在尝试运行一个最新的开发分支版本,但是,最新的开发分支已经不再支持xp,也就是说vista是最陈旧支持的客户端,windows server2003是最陈旧的window
2013-09-04 08:36:40 1659
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人