- 博客(8)
- 资源 (1)
- 收藏
- 关注
原创 单点小说作品库(下)
上文记录完爬虫和页面解析模块,下面首先介绍存储模块: 鉴于导师要求,存储使用nosql数据库:mongodb。还好此数据库比较好学,笔者在安装后,简单学习了一下,立即写出的存储程序。将小说数据全部存放到一个表中(mongodb成为collection,集合),一个小说建立一条记录(称文档),记录中存放各个字段。程序如下: #!/usr/bin/env python # -*- coding:
2015-01-26 11:59:31 550
原创 单点小说作品库(上)
这个小项目是笔者入职后第一个练手的任务,实现的功能是:从单个小说网站搜集小说数据,解析这些数据后存储到数据库中,然后提供访问数据的接口。实现这些大功能就需要四个模块:爬虫、页面解析器、数据库存储和数据访问接口。 首先,来说说爬虫。对于一个小白程序员,写不了专业的分布式多点爬虫,就简单的实现了一个单点爬虫(参考《Python核心编程》),由于要搜集数据的小说网站17k的web页面连接具有稳定的规律
2015-01-26 11:14:32 737
原创 站在巨人的肩膀上--傻瓜式编译ffmpeg for android
经过啦无数次失败,在快要放弃的时候,明明向我伸出温暖的援手,顿时拨云见日,柳暗花明……wake up,说正事: 说傻瓜式的编译毫不为过,当你尝试过按照网络上一些博客的方法编译不过的时候,就会感受到这里有多么傻瓜。 编译环境: Ubuntu 12.04; Android-ndk-r9; ffmpeg 在运行shell脚本的时候自动下载最新版本; 首先,编译前需要安装cca
2013-10-17 17:15:16 1942
原创 word中插入图片不能完全显示的问题
问题:插入图片是总是图片的底边与光变平行,导致图片只能显示一个底边 解决方法:格式-》段落-》行距设置为 :最小值,行距值 普通的15-20磅。具体可以参考这个视频 http://www.tudou.com/programs/view/cgNkmOKsTeY/
2012-06-07 14:28:19 1205
原创 java socket 通信 代码2-multiServer.java
import java.io.*; import java.net.*; import implement.ServerThread; public class multiServer{ static int clientnum;//静态变量,记录当前客户的数量 public
2011-07-09 23:03:56 451
原创 java socket通信代码3
package implement;//包定义 import java.io.*; import java.net.*; public class ServerThread extends Thread{//继承Thread类,实现多线程 Socket socket=nul
2011-07-09 22:53:36 447
原创 代码1
import java.io.*; import java.net.*; public class multiClient{ public static void main(String args[]){ System.out.println("Client:"); t
2011-07-09 22:46:13 359
原创 java代码
import java.io.*; import java.net.*; public class multiClient{ public static void main(String args[]){ System.out.println("Client:"); t
2011-07-09 22:15:03 495
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人