自然语言处理
孤独单行
这个作者很懒,什么都没留下…
展开
-
LBFGS 简单笔记
sample() lbfgs.c() { lm; 计算原函数和梯度fx ,g; d = - g; 计算xnorm,gnorm; 判定gnorm/xnorm 是否满足条件; 计算step = 1/sqrt(d^d) ; k = 1,end = 0; 进入for循环 { xp = x; gp =g; 进入line_search函数; { dginit = gs = gd原创 2013-07-29 16:31:47 · 1724 阅读 · 0 评论 -
CRF学习
刚才写了半天的文章,因为不小心点了舍弃,一切都要重来。怪自己不小心,不过这CSDN的自动保存功能做的有点弱。 迅速进入正题。这些天在研究CRF的东西,由于之前对机器学习的方面接触比较少,看CRF比较费力,现在把看到的一些想法分享出来,理解不到位的地方希望大牛过来指点指点。 一、CRF的概念和原理 参考《条件随机场理论综述》(韩冬雪、周彩根),这篇文章里面对CRF的基本理论都做了介绍,主要包括原创 2013-09-01 16:02:21 · 19005 阅读 · 0 评论 -
C++中实现对map按照value值进行排序
map的两个值分别为key值和value值,map是按照key值进行排序的,但有时候需要按照value值进行排序,并且按照value的顺序输出key值,排序代码如下: typedef pair PAIR; int cmp(const PAIR& x, const PAIR& y) { return x.second > y.second; } map m;转载 2013-09-04 16:09:37 · 3237 阅读 · 0 评论 -
C++ Map 统计文件中的词频
#include #include #include #include #include using namespace std; void display_map(map &wmap); int main() { using namespace std; string filename; cout << "Enter the file n原创 2013-09-04 16:12:51 · 4038 阅读 · 0 评论 -
字符编码笔记:ASCII,Unicode和UTF-8
来源:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html 作者: 阮一峰 日期: 2007年10月28日 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料。 结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚。 下面就是我转载 2013-12-03 11:08:56 · 822 阅读 · 0 评论 -
c++ string 转化为wstring
string 转 wstring std::wstring s2ws(const std::string &s) { std::string curLocale = setlocale(LC_ALL,""); const char * _Source = s.c_str(); size_t _Dsize = mbstowcs(NULL,_Source,0) + 1; wchar_t *_转载 2013-12-04 10:00:04 · 1663 阅读 · 0 评论 -
Python字符编码详解
1. 字符编码简介 1.1. ASCII ASCII(American Standard Code for Information Interchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的英文字符和许多的控制符号。不过ASCII只用到了其中的一半(\x80以下),这也是MBCS得以实现的基础。 1.2. MB转载 2014-04-09 15:13:08 · 534 阅读 · 0 评论 -
python xlrd 使用
1.获取单元格颜色 来自 stackoverflow import xlrd book = xlrd.open_workbook("sample.xls", formatting_info=True) sheets = book.sheet_names() print "sheets are:", sheets for index, sh in enumerate(sheets):原创 2015-02-04 16:43:12 · 4428 阅读 · 0 评论