- 博客(46)
- 资源 (11)
- 收藏
- 关注
转载 Mysql按字段分组取最大值记录
http://blog.sina.com.cn/s/blog_8155e74d0101g1pl.html每一个 subject 下面的 time 值最大的那条记录读取出来select * from (select * from log order by time desc) as a group by a.subject order by a.time
2015-07-29 21:02:54 508
原创 mysql binlog 日志 --- 数据库的备份
解决在 备份数据的时间点和mysql 崩溃时间点的数据恢复问题log-bin=mysql-bin #打开注释
2015-07-27 10:48:08 478
转载 使用搜狗词库制作mmseg自定义词典
使用搜狗词库制作mmseg自定义词典http://blog.atime.me/note/mmseg-custom-dict.html#content-heading总结使用搜狗词库制作mmseg词典的方法和步骤。另外,最近一直没写新博客,一方面是因为懒,另一方面是确实没什么可写的。coreseek的介绍和安装説明可参考这里,不再赘述。以下是接下来需要注意的几点:下面假设
2015-07-26 16:42:04 2199
原创 centos 开机自动启动
有些时候我们需要在服务器里设置一个脚本,让他一开机就自己启动。方法如下:cd /etc/init.d #在这个目录下的脚本文件 加上 chkconfig 命令后会自动执行vi youshell.sh #将youshell.sh修改为你自己的脚本名编写自己的脚本后保存退出。给脚本添加上可执行权限:chmod +x youshell.sh利用chkconfig命令
2015-07-26 14:53:20 399
原创 sphinx 增量索引
Sphinx 实时索引数据库中的数据很大,然后我有些新的数据后来加入到数据库中,也希望能够检索到,全部重新建立索引很消耗资源,这样需要用到“主索引+增量索引”的思路来解决,这个模式实现的基本原理是设置两个数据源和两个索引。1、创建一个计数器在数据库中增加一个计数表,记录将文档集分为两个部分的文档 ID,每次重新构建主索引时,更新这个表先在 mysql 中插入一个计数表CREATE
2015-07-25 16:31:25 434
原创 sphinx 的问题整理
1、排序字段没有找到sphinx sort-by attribute 'time' not found 作为sphinx 的配置文件里面的 sql_attr_uint 属性的值没有设置 ,就会报错。在配置文件里面找到sql_attr_uint 设置相应的字段名称 sql_attr_uint = time这样在实际排序的时候才会真正用到
2015-07-25 14:41:32 770
转载 sphinx分布式配置
http://blog.csdn.net/e421083458/article/details/23621159单机配置请参考搭建coreseek(sphinx+mmseg3)详细安装配置+php之sphinx扩展安装+php调用示例 分布式配置很简单,只需要将局域网内的机器连接即可。vi /usr/local/coreseek/etc/csft.conf[ph
2015-07-25 07:50:30 467
转载 python---mongodb
https://github.com/qiwsir/StarterLearningPython/blob/master/232.mdmongodb数据库(1)MongoDB开始火了,这是时代发展的需要。为此,本教程也要涉及到如何用python来操作mongodb。考虑到读者对这种数据库可能比mysql之类的更陌生,所以,要用多一点的篇幅稍作介绍,当然,更完备的内容还是要去阅读专业的mo
2015-07-24 20:32:23 1010
原创 python 黑名单过滤
需要过滤一些词语写了下面这个函数,在blacklist 文件中添加需要过滤的词语#过滤黑名单列表中出现的def in_lists(str): str_lists=[] fd = open('./filter/blacklist') for line in fd.readlines(): str_lists.append(line.st
2015-07-24 13:50:12 2526
原创 mongodb 增删改查
mongo 中表——>集合show dbs show collections 显示集合use imooc —— 如果没有则创建这个集合1、查询db.imooc_collection.find() ———查db.imooc_collection.find().count()db.imooc_collection.find().skip(3).limit(2).s
2015-07-24 09:32:39 342
原创 搭建简单的 mongodb
1、创建一个叫做mongodb_simple 的目录,进入到目录中2、创建文件夹 data,用来存储数据库的数据文件3、创建文件夹:log 用来存储数据库的日志文件4、创建文件夹:bin,用来存储数据库的可执行文件5、创建文件夹:conf,用来存储数据库的配置文件conf/mongo.confport = 12345dbpath = d
2015-07-24 09:31:41 336
原创 MongoDB 的使用
MongoDB 的使用1、最基本的文档的读写更新删除2、各种不同类型的索引的创建与使用3、复杂的聚合查询4、对数据集合进行分片,在不同分片间维持数据均衡5、数据备份与恢复6、数据迁移简单运维1、部署MongoDB集群2、处理多种常见故障 单节点失效,如何恢复工作 数据库意外被杀死如何进行数据恢复 数据库发生拒绝服务时如
2015-07-24 09:30:28 290
原创 MongoDB 安全
1、最安全的是物理隔离:不现实2、网络隔离其次3、防火墙再其次4、用户名密码在最后开启权限设置1、auth开启2、keyfile开启数据库角色集群角色备份角色其他特殊权限
2015-07-24 09:29:21 318
原创 Python-goose:用于文章提取的Python库
Python-goose项目是用Python重写的Goose,Goose原来是用Java写的文章提取工具。Python-goose的目标是给定任意资讯文章或者任意文章类的网页,不仅提取出文章的主体,同时提取出所有元信息以及图片等信息,支持中文网页。Python-goose可提取的信息包括:文章主体内容文章主要图片文章中嵌入的任何Youtube/Vimeo视频元描述元标签Python
2015-07-23 15:16:41 3466
转载 python使用mysql数据库
http://www.cnblogs.com/fnng/p/3565912.html一,安装mysql 如果是windows 用户,mysql 的安装非常简单,直接下载安装文件,双击安装文件一步一步进行操作即可。Linux 下的安装可能会更加简单,除了下载安装包进行安装外,一般的linux 仓库中都会有mysql ,我们只需要通过一个命令就可以下载安装:Ubuntu
2015-07-23 10:46:30 414
原创 nginx日志按日期自动切割脚本
nginx日志按日期自动切割脚本如下#nginx日志切割脚本#!/bin/bash#设置日志文件存放目录logs_path="/usr/local/nginx/logs/"#设置pid文件pid_path="/usr/local/nginx/nginx.pid"#重命名日志文件mv ${logs_path}access.log ${logs_path}access_$(dat
2015-07-23 10:35:49 1165
原创 webapp开发 --- ci--做服务端api 开发
简单说一下,很多地方并非自己原创,当然代码其实也很简单。代码下载地址 http://pan.baidu.com/s/1ntvaG9V在网上找到一个ci 开发的cms 程序,管理后台程序没有变,前端做成api 接口,通过参数读取数据。上代码解释。class Index_c extends CI_Controller { public function index(){
2015-07-23 10:33:04 1200
原创 webapp开发---后台框架 ci rest
上篇主要是了解 API 接口开发和网站开发其实区别很大,对于做网站开发php有很多框架,同样php 做API接口框架也有很多,这里选择 CI 的 rest 框架,复制下面这个链接,做一些了解,并下载框架。http://codeigniter.org.cn/forums/thread-4501-1-1.html rest 是一种模式,具体可以百度。CI 的 rest 框架
2015-07-23 10:31:55 834
转载 写给不太了解PHP与API开发的人
这个帖子写给不太了解PHP与API开发的人一、先简单回答两个问题:1、PHP 可以开发客户端?答:不可以,因为PHP是脚本语言,是负责完成 B/S架构 或 C/S架构 的S部分,即:服务端的开发。(别去纠结 GTK、WinBinder)2、为什么选择 PHP 作为开发服务端的首选?答:跨平台(可以运行在UNIX、LINUX、WINDOWS、Mac OS下)低消耗(P
2015-07-23 10:30:40 670
原创 webapp 开发 ---- phonegap 环境搭建
一、先介绍几个工具和命令1、PhoneGap Desktop-App: 简单的说它就是一个安装在win或者mac上的一款软件PhoneGap Desktop-App可以在不搭建andrid 环境不配置android sdk 或者不搭建xcode环境,或者不安装 node.js npm 的情况下就可以创建phoengap应用
2015-07-23 10:29:17 678
原创 python 自己写爬虫 ---- 总结需要的包
技术热线:urlliburlib2pyquery ------ 能够以 jQuery 的语法來操作解析 HTML 文档 https://pypi.python.org/pypi/pyquery/beautifulSoup http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html
2015-07-23 10:23:37 2802
原创 python 自己写爬虫 ----- BeautifulSoup
html ----- 获取了 源链接的 html soup = BeautifulSoup( html ) ----- 获得BeautifulSoup对象获得特定标签或有着特定属性的标签: titleTag = soup.html.head.title输出:#理财顾问招聘-信泽联合基金招聘-拉勾网title_tag = soup.html.
2015-07-23 10:22:25 474
原创 一个php curl 的例子
http://apistore.baidu.com/apiworks/servicedetail/632.html $ch = curl_init(); $url = 'http://apis.baidu.com/txapi/weixin/wxhot?num=10&rand=1&word=%E7%9B%97%E5%A2%93%E7%AC%94%E8%AE%B0'
2015-07-23 09:52:32 352
原创 (修改)中文分词
phpanalysis 分词系统中提供了一个获取关键词的 方法,返回值是包含关键词的字符串,而没有关键词在文本中出现的次数。针对这个我对源代码做了修改github链接https://github.com/hani1990/Search-engine
2015-07-22 16:07:22 420
原创 linux 磁盘操作命令
ls -lh — 查看目录大小du -shdu -shS df —— 分区命令df -h fdisk -lsync —— 同步内存的数据到硬盘,机器重启之前用到lsof /home 查看谁在使用该目录增加硬盘1、关机init 0shutdown -h now2、添加硬盘3、分区,挂载fdisk -l
2015-07-21 09:36:16 440
原创 Solr配置文件 ----- 添加中文分词IKAnalyzer
schema.xml 文件中添加中文分词IKAnalyzer 的配置中文分词的jar 放置 的目录
2015-07-21 09:22:30 384
转载 sphinx 权重计算
原文链接http://www.onelose.com/post/195sphinx搜索字段权重设置有一张表:包含的字段有,(行业,地区,职位)须要对这3个字段查询。然后按照字段的命中排序。不管一个字段有多少数据,对于一个字段只要命中了就算一次,然后对应的不同字段乘以对应字段应该的权重。比如行业命中那么权重*1,地区命中那么权重*2,职位命中那么权重*2总权重=(行业字段
2015-07-19 15:37:54 1807
原创 sphinx 配置
/usr/local/coreseek/etc进入配置文件所在目录 csf.conf # whether to strip HTML tags from incoming documents # known values are 0 (do not strip) and 1 (do strip) # optional, default is 0
2015-07-18 17:06:34 386
原创 mmseg 增加词库
/usr/local/mmseg/etc这个目录下1、了解几个文件mmseg.ini unigram.txt uni.libuni.lib --------- 编译后的词库unigram.txt ---- 原词库给人看的, 在这里面添加词库2、添加词条海斯队 1x:1丝路 1x:1令人心悸 1x:13、重新编
2015-07-18 16:43:46 1012
转载 sphinx全文检索之PHP使用教程
sphinx全文检索之PHP使用教程http://www.php100.com/html/php/lei/2013/0916/6188.html以上一篇的email数据表为例:数据结构:view sourceprint?01.CREATETABLE email (02.emailid mediumint(8) unsignedNOT
2015-07-18 14:36:23 880
原创 php 操作sphinx
sphinx 安装完成之后1、生成主数据索引cd /usr/local/coreseek/bin./indexer ind_main2、启动 searchd 进程,为php 程序连接准备./searchd [root@localhost bin]# ./searchdCoreseek Fulltext 3.2 [ Sphinx 0.9.
2015-07-18 12:04:43 821
原创 sphinx --- 安装中碰到的问题
coreseek-3.2.14 版本 解压后csft-3.2.14 (这个就是sphinx)mmseg-3.2.14 (分词程序)在源码编译安装 mmseg 的时候会报错解压安装cd /lamptar -zxvf coreseek-3.2.14.tar.gz进入到 mmseg所在文件夹,先安装中文分词 mmsegcd /lamp/coreseek
2015-07-18 10:11:58 2013
转载 Google的十大信条
公司简介关于我们我们的文化工作地点管理团队我们的理念 我们的业务Google的十大信条 我们首次拟就这“十大信条”还是在Google刚刚成立没几年的时候。此后,我们时常重新审视这份清单,看看它是否依然适用。我们希望这些信条永不过时,而您也可以监督我们是否遵守了这些信条。以用户为中心,其他一切自然水到渠成。 自创建伊始,Google就一
2015-07-18 08:55:28 564
原创 solr ------ 名词解释
1、分词2、token倒排表最小单位,即分词中 词3、Term:query 的最小单位,title:皇帝4、Tf:一个term 在一个文档中出现的次数5、Idf:一个term 在多少个文档中出现过6、向量运算
2015-07-17 09:46:41 604
转载 iptables 详解
iptables详解--转出处:http://yijiu.blog.51cto.com/433846/1356254iptables详解基本概念:1.防火墙工作在主机边缘:对于进出本网络或者本主机的数据报文,根据事先设定好的检查规则对其检查,对形迹可疑的报文一律按照事先定义好的处理机制做出相应处理对linux而言tcp/ip协议栈是在内核当中,意味着报文的处理是在内核中
2015-07-17 09:19:59 574
原创 php ci框架 里面使用 memcache 存 session
传送门https://github.com/cnsaturn/codeigniter-my-sessionhttp://blog.csdn.net/weilee2009/article/details/7658260又一个使用PHP原生Session机制来代替CI默认Cookie机制Session的解决方案;同时,如果服务器支持memcached,那么本类也可以使用Memcac
2015-07-15 20:41:58 1966
原创 PHP + Memcache 实现多服务器session共享 (补充)
先说系统环境wdcp 的安装包,就不用多说了,具体的看这篇博文 wdcp 或者 阿里云一键安装包 再也不用担心 服务器环境搭建了然后也是用wdcp 官网提供的安装 memcache 的脚本[教程] memcached的启用和设置http://www.wdlinux.cn/bbs/thread-1373-1-1.html实际安装的过程中报错,提示这个
2015-07-15 20:25:24 567
原创 wdcp 或者 主机宝 或 阿里云一键安装包 再也不用担心 服务器环境搭建了
官网链接 http://www.wdlinux.cn/wdcp/install.htmlwdCP是WDlinux Control Panel的简称,是一套通过WEB控制和管理服务器的Linux服务器管理系统以及虚拟主机管理系统常用命令service wdapache start|stop|restart wdcp后台 启动|停止|重起service nginxd st
2015-07-15 16:09:57 1951
原则 pdf 作者: [美] 瑞·达利欧
2019-04-03
php--二维码生成代码
2015-07-23
gh0st的socket内核文件
2014-06-05
CTrueColorToolBar 类
2014-06-04
使用OllyDbg从零开始Cracking
2014-05-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人