DanielWang_
码龄16年
关注
提问 私信
  • 博客:953,357
    社区:1,289
    954,646
    总访问量
  • 108
    原创
  • 826,337
    排名
  • 357
    粉丝
  • 0
    铁粉

个人简介:对开源、NLP、网络编程等领域感兴趣 共同学习~~ best wishes

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2009-05-11
博客简介:

Daniel 的技术笔记 不积跬步无以至千里,不积小流无以成江海。

博客描述:
查看详细资料
个人成就
  • 获得350次点赞
  • 内容获得135次评论
  • 获得705次收藏
  • 代码片获得350次分享
创作历程
  • 4篇
    2017年
  • 2篇
    2016年
  • 5篇
    2015年
  • 19篇
    2014年
  • 57篇
    2013年
  • 30篇
    2012年
  • 5篇
    2011年
  • 1篇
    2010年
成就勋章
TA的专栏
  • nginx 源码学习
    6篇
  • c/c++/cpp11
    16篇
  • 数据结构、算法
    27篇
  • unix/linux/网络编程
    29篇
  • ML/NLP
    6篇
  • 编程练习ACM
    14篇
  • 代码阅读
    4篇
  • Nginx
    11篇
  • redis
    4篇
  • 数据库、MySql
    4篇
  • tcp/ip
    6篇
  • 设计模式
  • awk & sed
    2篇
  • linux shell
    13篇
  • python / Django / flask
    8篇
  • lua
  • git
    1篇
  • Hadoop
    4篇
  • HBase
    3篇
  • hive
    1篇
  • Windows程序设计笔记
    7篇
  • 个人博客系统
    1篇
  • 杂谈
    8篇
创作活动更多

HarmonyOS开发者社区有奖征文来啦!

用文字记录下您与HarmonyOS的故事。参与活动,还有机会赢奖,快来加入我们吧!

0人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

cython的使用

0. 环境配置要使用cython首选得有的她的环境 [ 废话,^_^ ],系统上有pip包管理环境的话直接:pip install cython 即可安装cython或者也可以源码安装: https://github.com/cython/cython/wiki/Installing 1. 相关介绍: Cython 编译器把 Cython 代码编译成调用了 Python 源码的 C/C++ 代码
原创
发布博客 2017.08.27 ·
14101 阅读 ·
3 点赞 ·
0 评论 ·
13 收藏

C++自动微分(Automatic differentiation)原理1

0. 缘由下面介绍下为什么要引入自动 自动微分(automatic differentiation -> AD )。一个优化问题的例子 假设现在我们在解决一个机器学习的问题,有了一些训练样本,现在需要寻找一个最优的函数,使得函数对输入X的估计Y’与实际输出Y之间的期望风险最小化。利用已知的经验数据(训练样本)来计算得到的误差,被称之为经验风险。使用对参数求经验风险来逐渐逼近理想的期望风险的最小值
原创
发布博客 2017.08.21 ·
14786 阅读 ·
15 点赞 ·
3 评论 ·
67 收藏

Recipes for adjoint code construction

发布资源 2017.08.20 ·
pdf

奇异递归模板模式(CRTP)应用--表达式模板(expression template) 2

1 表达式模板(expression template)概述首选分几个部分介绍下expression template。1.1 表达式模板(expression template)是什么?引用wiki 介绍的 Expression templates : Expression templates are a C++ template metaprogramming technique that
原创
发布博客 2017.07.12 ·
5925 阅读 ·
3 点赞 ·
2 评论 ·
12 收藏

奇异递归模板模式( Curiously Recurring Template Pattern,CRTP)1

1.CRTP介绍奇异递归模板模式(curiously recurring template pattern,CRTP)是C++模板编程时的一种惯用法(idiom):把派生类作为基类的模板参数。更一般地被称作F-bound polymorphism,是一类F 界量化,相关介绍可以参考 wiki 奇异递归模板模式。curiously recurring template pattern,CRTP的来源,
原创
发布博客 2017.06.25 ·
12423 阅读 ·
15 点赞 ·
1 评论 ·
31 收藏

中文分词 mmseg nginx 模块开发

一、nginx模块开发Nginx 是一款高性能web服务器,因此,工作业务中需要借助nginx强大的网络服务功能,往往需要开发和定制相应的 Nginx 模块满足业务需求。 基本上作为第三方开发者最可能开发的就是三种类型的模块,即handler,filter和load-balancer。Handler模块就是接受来自客户端的请求并产生输出的模块,也是我们使用最多的一个模块。有关nginx模块开发的
原创
发布博客 2016.01.17 ·
4074 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

mmseg分词算法及实现

一、分词方法关于中文分词 参考之前写的jieba分词源码分析 jieba中文分词。 中文分词算法大概分为两大类:一是基于字符串匹配,即扫描字符串,使用如正向/逆向最大匹配,最小切分等策略(俗称基于词典的) 基于词典的分词算法比较常见,比如正向/逆向最大匹配,最小切分(使一句话中的词语数量最少)等。具体使用的时候,通常是多种算法合用,或者一种为主、多种为辅,同时还会加入词性、词频等属性来辅助处理
原创
发布博客 2016.01.10 ·
12285 阅读 ·
9 点赞 ·
4 评论 ·
18 收藏

viminstall.tar.gz

发布资源 2015.12.28 ·
gz

jieba中文分词源码分析(四)

一、未登录词问题在jieba中文分词的第一节曾提到未登录词问题 中文分词的难点 分词规范,词的定义还不明确 (《统计自然语言处理》宗成庆) 歧义切分问题,交集型切分问题,多义组合型切分歧义等 结婚的和尚未结婚的 => 结婚/的/和/尚未/结婚/的 结婚/的/和尚/未/结婚/的 未登录词问题 有两种解释:一是已有的词表中没有收录的词,二是已有的训练语料
原创
发布博客 2015.09.06 ·
12675 阅读 ·
4 点赞 ·
2 评论 ·
22 收藏

jieba中文分词源码分析(二)

一、jieba的使用举例jieba的简单使用 我们根据作者的 github的例子来编写一个自己的例子,代码如下:# encoding=utf-8import jiebaseg_list = jieba.cut("去北京大学玩123", cut_all=True)print("Full Mode: " + "/".join(seg_list)) # 全模式seg_list = jieba.
原创
发布博客 2015.09.05 ·
8754 阅读 ·
3 点赞 ·
1 评论 ·
11 收藏

jieba中文分词源码分析(三)

一、前缀字典作者这个版本(0.37)中使用前缀字典实现了词库的存储(即dict.txt文件中的内容),而弃用之前版本的trie树存储词库,python中实现的trie树是基于dict类型的数据结构而且dict中又嵌套dict 类型,这样嵌套很深,导致内存耗费严重,具体点这里,下面是@gumblex commit的内容: 对于get_DAG()函数来说,用Trie数据结构,特别是在Python环
原创
发布博客 2015.09.05 ·
11404 阅读 ·
4 点赞 ·
1 评论 ·
15 收藏

jieba中文分词源码分析(一)

一、缘由接触自然语言处理(NLP)有段时间,理论知识有些了解,挺想动手写些东西,想想开源界关于NLP的东西肯定不少,其中分词是NLP的基础,遂在网上找了些资源,其中结巴分词是国内程序员用python开发的一个中文分词模块, 源码已托管在github: 源码地址 ,代码用python实现,源码中也有注释,但一些细节并没有相应文档,因此这里打算对源码进行分析,一来把知识分享,让更多的童鞋更快的对源码有个
原创
发布博客 2015.09.03 ·
19859 阅读 ·
16 点赞 ·
4 评论 ·
45 收藏

rmtrash.zip

发布资源 2015.08.20 ·
zip

使用Hadoop Streaming

hadoop大家都了解的,不再细说。之前用java写过MR程序,对Hadoop streaming了解不多,Hadoop streaming是和Hadoop一起发布的实用程序,它允许用户创建和执行使用任何程序或者脚本编写的map或者reduce的mapreducejobs,实际工作中看到不少同学用python、shell、Perl等编写Hadoop streaming程序(开发效率确实高)。在运行
原创
发布博客 2015.08.02 ·
3739 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

redis 源码分析(一) 内存管理

一,redis内存管理介绍  redis是一个基于内存的key-value的数据库,其内存管理是非常重要的,为了屏蔽不同平台之间的差异,以及统计内存占用量等,redis对内存分配函数进行了一层封装,程序中统一使用zmalloc,zfree一系列函数,其对应的源码在src/zmalloc.h和src/zmalloc.c两个文件中。二,redis内存管理源码分析redis封装是为了
原创
发布博客 2014.05.21 ·
7111 阅读 ·
4 点赞 ·
0 评论 ·
1 收藏

Redis c/c++, java 客户端连接

Redis 介绍redis 这个想必大家都了解,关于redis的安装参考这里,redis使用文档参见这里。Redis C客户端的使用方法 Redis的c客户端 Hiredis使用比较广泛,下面主要介绍下它。1,Hiredis的安装,配置Hiredis客户端 在redis解压后的deps/hiredis下有相应的文件。如果你的安装包没有相应的文件可以到这里下载。cd
原创
发布博客 2014.05.16 ·
8923 阅读 ·
5 点赞 ·
0 评论 ·
4 收藏

jedis-2.4.2.jar

发布资源 2014.05.16 ·
jar

最长递增子序列(LIS)求解

问题描述最长递增子序列也称 “最长上升子序列”,简称LIS ( longest increasing subsequence)。设L=是n个不同的实数的序列,L的递增子序列是这样一个子序列Lis=,其中k1如:求一个一维数组arr[i]中的最长递增子序列的长度,如在序列{ 7, 1, 6, 5, 3, 4, 8 }中,最长递增子序列长度为4,其递增子序列为:1,3,4,8。
原创
发布博客 2014.05.13 ·
4942 阅读 ·
6 点赞 ·
0 评论 ·
1 收藏

c++ 智能指针及 循环引用问题

c++智能指针介绍由于 C++ 语言没有自动内存回收机制,程序员每次 new 出来的内存都要手动 delete,比如流程太复杂,最终导致没有 delete,异常导致程序过早退出,没有执行 delete 的情况并不罕见,并造成内存泄露。如此c++引入智能指针 ,智能指针即是C++ RAII的一种应用,可用于动态资源管理,资源即对象的管理策略。 智能指针在 标头文件的 std 命名空间中定义
原创
发布博客 2014.04.07 ·
21647 阅读 ·
15 点赞 ·
1 评论 ·
38 收藏

C++ 类型转换及RTTI

C++的4中类型转换我们应该比较熟悉C的类型转换即由圆括号和标识符组成,但是对于C的类型转换有时候到不到我们的要求,比如去除const 的类型转换,把一个指向基类的指针转化成指向子类的指针等等。下面就介绍C++引进的四个新的类型转换操作符,这四个操作符是:static_cast, const_cast, dynamic_cast, 和reinterpret_cast。1,const_cas
原创
发布博客 2014.03.18 ·
4436 阅读 ·
4 点赞 ·
0 评论 ·
3 收藏
加载更多