维基百科数据整理感想

原创 2013年12月02日 16:39:29

这段时间一直在整理维基离线数据库的东西,收获很多:

1、看完手册再动手

一开始拿到数据库就开始写程序,连离线数据库的格式说明都没有看,自然是各种失败,无意中看了格式手册,恍然大悟,便很顺利的在写,收取的信息也很不错。

2、繁简互转

在中文数据中,繁简都有,这个处理起来比较麻烦,于是先都转成简体然后载处理,这样就好处理多了。

3、格式转换

现在一拿到维基数据都是先转换成自己的格式再处理,这样自己写的程序就可以一直用了。

4、数据与表现分离

现在深深感觉到两者分离的好处,一开始的界面展示程序一直在用,只需要把数据处理就可以了。每次改数据和改界面都互不影响。

5、想好思路再动手

现在想程序思路,画流程图什么都要很长时间,写代码相对就容易,逻辑上的错误十分容易找出,语法等错误,一般情况下只需百度就行。

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

维基百科上的算法和数据结构链接很强大

突然发现维基百科上的算法和数据结构比百度百科强多啦,图文并茂。其实这个网站不错:http://www.sorting-algorithms.com冒泡排序:bubble冒泡的意思http://zh.w...

Mahout in action分析维基百科数据例子(一)

本文来源于我个人博客www.chenbiaolong.com概要本文主要根据mahout in action第六章分析维基百科链接数据的例子编写。大部分内容是直接翻译的mahout in action...

数据恢复学习伊始————文件系统(转自维基百科)

咚咚咚……计算机的文件系统是一种存储和组织计算机文件和数据的方法,它使得对其访问和查找变得容易。文件系统通常使用硬盘和光盘这样的存储设备,并维护文件在设备中的物理位置。但是,实际上文件系统也可能仅仅是...

什么是SaaS(翻译自维基百科)

软件即服务(SaaS),有时被称为“按需提供软件”,指的是一种软件供应模式,这种模式下软件和相关的数据都被集中的托管到云端。用户常常用瘦客户端通过web浏览器访问SaaS服务。 SaaS已经成为大多...

维基百科代码

  • 2015-06-30 16:14
  • 20.86MB
  • 下载

消息队列——维基百科

消息队列 在计算机科学中,消息队列(英语:Message queue)是一种进程间通信或同一进程的不同线程间的通信方式,软件的贮列用来处理一系列的输入,通常是来自使用者。消息队列提供了异...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)