自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (2)
  • 收藏
  • 关注

原创 情感分析系列之《利用BRAT进行中文情感分析语料标注》

情感分析是NLP中的一大分支,无论在学术界还是工业界都有广泛的研究,在SemEval语义分析会议中有单独的情感分析任务分支,其中最难的一个任务叫做ABSA:Aspect-Based Sentiment Analysis,面向方面的情感分析.本文主要介绍如何利用BRAT进行针对ABSA问题的语料标注,后续如何利用这些标注构建模型来解决ABSA问题将在随后的文章中介绍。本系列的所有的工作都来自WeTest舆情团队的努力成果(http://wetest.qq.com/bee/)。

2015-11-11 12:59:52 22694 10

原创 理解朴素贝叶斯分类器的三层境界

1.背景首先,在文章的开头,先提出几个问题,如果这些问题你都答得上来,那么本文你就无需阅读了,或者你阅读的动机纯粹是给本文挑毛病,当然我也无比欢迎,请发送邮件“毛病の朴素贝叶斯”发送至[email protected],我会认真阅读你的来信。By the way,如果阅读完本文,你还是无法回答以下问题,那么也请你邮件通知我,我会尽量解答你的疑惑。朴素贝叶斯分类器中的“朴素”特指此

2014-11-23 23:21:38 13451 1

原创 C++设计模式Decorator简单实现

/** Decorator可以为对象而不是整个类扩展功能,并且原部件不需要知道扩展的存在* 本模式非常适合与现有架构的修改而不是重构,并且适合于基础部件(abstract component)体积较小的场合* 如果基础部件本身很大,更适合用Strategy模式,为部件注册策略类并执行各策略*/#includeclass VisualComponent { public:

2013-09-12 09:35:35 992

原创 C++设计模式Visitor+Iterator简单实现

#include#include#includeclass ElementA;class CompositeElement;templateclass MyList;templateclass MyListIterator;templateclass MyList{ public: MyList():m_size_(0), m_member_(new T

2013-09-11 11:30:45 1261

原创 初学sqlite 锁协议

对Sqlite3的锁机制简单分析,本人新手,欢迎大家指正。sqlite用五种锁实现ACID:1. Nolock:应用处于初始状态2. Shared:在读操作前获得的锁。(可以有多个应用共享Shared lock)3. Reserved:表示应用将来有写的意图。(此时其他应用可以获得Shared lock)4. Pending:表示应用正在因为要执行写操作而等全部Shar

2013-01-21 14:20:38 1668

翻译 win7操作系统对多核的支持

微软从windows vista开始增加对多核的支持,但是直到win7才真正改善了底层的技术。第一款桌面双处理器处理器于2005年出现在市场上,发型的产品包括Intel Pentium D和AMD Althon 64 X2.这时的双处理器只是工艺上允许在一个封装里容纳两个CPU,而非真正意义上的双核。这些年来,有很多双处理器可以选择,然而这些仅仅意味物理上把两个CPU放在一起,并且功耗增加

2012-11-08 22:09:41 10396

原创 nginx学习之路(1)

一直都想找一款开源的web server来读,苦于没有时间。今天心血来潮把著名的nginx给checkout出来,打算开始一睹其芳容,希望自己能坚持下来,所以也打算把学习的点滴过程记录下来成为手记。由于我自己是初学者,所以这些手记或许对更多的初学者会有些参考价值,也希望大牛可以指正我的任何错误,我将不胜感激。学习一款优秀的开源软件,可以从源码入手,nginx的源码完全由c语言构成,很适合初

2012-11-03 15:08:09 1564 1

原创 intel强力分析工具Pin的使用入门(1)

Pin是intel公司推出的一款动态二进制分析框架,可以用于构建强大的动态程序分析工具。比如CPM$im模拟器就是基于Pin开发的。Intel为了封锁技术,并没有让Pin开源,但是提供了其编译版本供使用,用户可以以外挂的形式扩展自定义的分析函数。本文内容来自Pin的官方用户手册http://software.intel.com/sites/landingpage/pintool/docs/

2012-11-03 13:38:52 14422 3

原创 Apriori中的hash tree

总算把hash tree算法弄懂了,不敢独乐,特来分享hash tree(哈希树),是由tree和hash table结合,旨在优化hash table冲突解决方案的一种数据结构。在链式hash table中,若关键字发生冲突,则创建单个新节点链到冲突节点之后,并把关键字插入到新节点。而在hash tree结构中,若关键字发生冲突,则创建一组新节点链到冲突节点之后,并把关键字hash后

2012-06-02 15:32:20 19164 12

原创 Bloom Filter算法

介绍:     Bloom filter 是一种节约空间的数据结构,用于检测元素是否为集合的成员。Bloom filter可能误判,但不会漏判,所以可以用于判断:“元素是否在集合中(有一定错误概率)”“元素一定不在集合中(找到所有可能在的,剩下就是一定不在的)”。     误判的概率随着元素数目增多而变大。算法描述:     一个空的Bloom filter含有

2012-05-31 10:37:16 1068

原创 数组个数匹配

题目来自http://topic.csdn.net/u/20101011/16/2befbfd9-f3e4-41c5-bb31-814e9615832e.html给你10 分钟时间,根据上排给出十个数,在其下排填出对应的十个数 要求下排每个数都是先前上排那十个数在下排出现的次数。 上排的十个数如下: 【0,1,2,3,4,5,6,7,8,9】 初看此题,貌似很难,10 分钟过去

2012-05-26 11:20:18 1050

原创 数据挖掘--挖掘频繁模式、关联和相关(2)

上一篇文章简述了挖掘频繁模式的基本概念:频繁模式即频繁出现在数据集中的模式,模式的类型有很多种,比如项集,序列和结构。频繁模式的挖掘就是关联规则的挖掘,就是通过找出所有的频繁模式然后推导出规律性的结论。本文继续讨论频繁项集的挖掘方法,我们分析的模型仍然是最简单的“单维、单层、布尔频繁项集”。我们介绍的方法称为Apriori算法。Apriori算法:利用频繁项集性质的先验知识,使用层序搜索迭

2012-04-21 21:00:09 2864

原创 数据挖掘--挖掘频繁模式、关联和相关(1)

学习是一件很苦的事情,但是有时却是一件很神奇的事情,神奇到原本很抽象枯燥的知识点你却可以取其精华的理解,这时效率最高此时务必将心得写下以下读书笔记来自我在阅读《数据挖掘-概念与技术》的一点感受所谓挖掘频繁模式,关联和相关,即指在出现的数据集中找到一个经常出现的序列模式或者是一个经常出现的数据结构。就像搞CPU设计的人知道,Cache的预取机制有流预取和指针预取,前者就是发现流模式,

2012-04-19 21:33:53 1984

翻译 什么是SaaS(翻译自维基百科)

软件即服务(SaaS),有时被称为“按需提供软件”,指的是一种软件供应模式,这种模式下软件和相关的数据都被集中的托管到云端。用户常常用瘦客户端通过web浏览器访问SaaS服务。SaaS已经成为大多数商务应用的常见供应模式,包括统计,协作,客户关系管理(CRM),管理信息系统(MIS),企业资源计划(ERP),发票,人力资源管理(HRM),内容管理(CM)和服务台管理。SaaS模式已经被用于所有

2012-04-19 14:24:00 2913

原创 线性时间排序

最近的几篇文章将都关于排序算法,希望能跟大家一起进步,一起深入的去理解排序问题的本质与思路。由于本人在算法方面还处于菜鸟阶段,所以文章的面向读者为广大算法入门人士,希望高手门高抬贵手。本文将讨论线性时间排序算法,关于非线性时间算法将另开专题讨论。开篇:御剑术---计数排序计数排序,一言以蔽之,就是统计每个元素的个数,用来推断它最终的位置:显然,它的最终位置等于比它小的数

2012-04-17 22:14:07 777

原创 最长子段问题求解

问题描述: 一个N个整数的数组(A[0] ... A[n-1]), 求这个数组的子数组的最大和。举例:数组:A = [1, -2, 3, 5, -3, 2] 返回: 8解法一: 穷举法穷举出所有的子数组,分别求和,最后选出最大值n个元素的组合有n*(n-1)种,对每种组合求和需要c次,其中c为该组合元素数因而该算法复杂度为O(n2)*O(n) = O(n3)假设

2012-04-12 14:36:18 828

原创 Python学习(三)

<br />第四章 字符串处理<br />1.字符串类型<br />字符串类型的输入不再是input,而是raw_input,字符串的索引用大括号str[i],比如uname=first[0]+last[:7]可以得到一个姓名的缩写。for循环可以用于索引字符串里的每个字母:for ch in "my string"。有两个用于在字符和其ASICII码间转换的函数:<br />>>ord("a")<br />97<br />>>chr(97)<br />'a'<br />要把一句话里的每一个词分离出来可用s

2011-01-10 17:12:00 1053

原创 关于Cache一致性

<br />总算是把Hennessy&Patterson的多处理器和线程级并行拿下了,由于多处理器领域的问题多多,很多也没有一个统一的解决标准,所以关于这一领域两位大师主要是把研究集中在了Cache一致性上,也就是如何保证多核间共享的数据可以保持一致。<br />总体上分为两种策略:1. snooping--监听策略,2. Directory based--基于目录<br />在我们分析两种策略前,先明白几个问题,首先我们要知道我们的,目标是什么?系统模型是什么?<br />1.模型与需求<br />系统模

2011-01-10 15:41:00 1347

原创 动态调度

为了节约成本的同时提高性能,方法之一是动态调度技术。动态调度:从字面上来说就是让硬件动态的决定执行什么指令,按什么顺序执行,而不是由编译器静态的决定。(后者为静态调度,如循环展开)本质上来说动态调度使得指令乱序执行,这很像数据流machine,后者不是按照发射顺序执行,而是按照数据的availability来执行,当然实际中还要考虑资源的有限量。因而,请记住指令的执行依赖于1:原操作数的可用性。2:所需功能单元的可用性。动态调度可以利用到编译时无法发现的并行性。有两种动态调度技术:一:计分板计分板会监视所有

2011-01-07 21:12:00 8622

原创 Python学习 (二)

<br />第二章<br />软件的如果没有一种系统的方法将会变得非常可怕。<br />2.1 软件开发流程<br />         阐述需求:弄清楚到底要解决什么问题。<br />         确定计划:明确程序能完成什么任务,简单来说就是输入input与输出output是什么,<br />以及他们之间的关系。<br />         建立构思:阐述程序架构,设计算法。<br />         实施构思:根据构思将算法用语言实现,本书用Python<br />         测试调试:<

2011-01-07 16:23:00 914

原创 Python学习 (一)

<br />参考资料:《Python Programming:An Introduction to Computer Science》<br /> <br />今天开始学习Python,环境是ubuntu10.04,系统预装了Python 2.6.5,基于Gcc 4.4.3。为了可以编写方便,我安装了Python专用的编辑器idle<br />    sudo apt-get install idle<br />安装成功后在命令行输入idle chaotic.py开始第一个程序,弹出命令界面不用管,可以关掉

2011-01-06 15:13:00 977

翻译 什么是计算机科学

<br />      计算机科学研究的不是计算机本身,著名计算机科学家Edsgar Dijkstra曾经这样比喻:计算机对于计算机科学就像望远镜对于天文学一样。计算机是工具,不是研究的对象本身。由于计算机能够实现我们所描述的任意功能,因此真正的问题是:我们可以描述什么样的功能?换言之根本的的问题在于计算机能计算出什么?三种主要的方法:设计,分析,实验。<br />      要证明一个问题可以被解决,最好的办法就是找到一种解决它的办法,也就是找到一种过程一步一步的达到期望的目的,计算机科学称之为算法。<b

2011-01-06 13:49:00 1038

原创 ARM存储管理(二)

<br />4:二级描述符<br />每个二级粗表项对应4KB虚拟地址的映射,而二级细表项对应1KB虚拟地址映射。每一项都是一个页描述符,分别可以描述一块大于4KB或1KB大小的页,此时同一个描述符会被多次使用,以确保不同虚拟地址都访问相同的物理页。根据二级描述符的最低两位:<br />l  位[1:0]=0b00:此时所关联的虚拟地址不映射<br />l  位[1:0]=0b01:此时该项为大页描述符,描述64KB的虚拟地址。在一个二级细表中,大页描述符必须重复64次,而在二级粗表中,大页描述符要重复16

2010-12-23 10:55:00 833

原创 ARM存储管理(一)

ARM的MMU地址翻译机制是操作系统内存管理的基础,关于ARM的地址翻译机制方面的文章很少,本文是基于ARM手册的翻译文章。

2010-12-21 11:18:00 779

原创 12.20调试笔记

<br />今天在启动代码里加入了外部中断处理程序,但是总是出错,debug跟踪发现程序停在UNDEF模式下死循环,查看arm9手册发现UNDEF异常模式的进入是因为cpu取到了不能识别的指令。于是思考,观察我的start.S中,有一段是将flash拷贝到sdram,大小是1K字节,想想可能由于在我的代码中加入了printf函数以及其依赖的库函数,导致代码大小剧增,原来的1k字节已经不够,因而使cpu取到了未定义的sdram指令,于是增大拷贝大小,再次调试,成功!

2010-12-20 10:06:00 629

ARM Architecture Reference Manual

官方的arm参考手册,适合从事arm专业的学习

2010-12-19

RTL8201BL.pdf

Realtack的网卡RTL8201BL的用户manual,

2010-11-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除