shiter编写程序的艺术

大数据生态圈,计算机视觉,机器学习,高端技术的爱好者,话不多说,上代码!!!...

从前有一个程序员,成天写代码,后来,他屎了。。。

每天你都有机会和很多人擦身而过,而你或者对他们一无所知,不过也许有一天他会变成你的朋友或是知己……先来看看老王和他的IT界朋友们吧p.s 经常有人问我,老王,你明明可以穿的挺帅,为什么总是穿的很随意呢?其实道理很简单,我是做技术活的,打扮太好人家会以为我技术不行。从前有一个程序员,成天写代码,后来...

2016-07-14 20:50:36

阅读数 18193

评论数 53

《自然语言处理实战入门》 ---- 第3课 :本人CSDN博客的爬取

本文为《自然语言处理实战入门》第3课 文章大纲如何爬取本人CSDN 博客Anaconda安装selenium如何一次性安装 conda 环境中的python 包语料收集资料合集清华大学北京大学语料库在线(教育部语言文字应用研究所计算语言学研究室)大规模中文自然语言处理语料搜狗实验室中英文NLP 差...

2019-04-22 09:55:25

阅读数 59

评论数 0

《自然语言处理实战入门》 ---- 第2课 :网络爬虫简介

我们平时做自然语言处理,机器学习,都是希望能够有丰富的训练数据集,这样才能获取质量上乘的模型。在大数据时代,处理数据已经不再是是问题了,spark,hadoop ,Elastic search提供了海量甚至巨量的分布式数据处理方法。问题是没有数据怎么办?在合理合法 的前提下自然语言处理 的语料和其...

2019-04-14 23:24:21

阅读数 71

评论数 0

一文详解中英文在NLP上的10大差异点

作者 | 达观数据创始人 陈运文 人类经过漫长的历史发展,在世界各地形成了很多不同的语言分支,其中汉藏语系和印欧语系是使用人数最多的两支。英语是印欧语系的代表,而汉语则是汉藏语系的代表。中英文语言的差异十分鲜明,英语以表音(字音)构成,汉语以表义(字形)构成,印欧和汉藏两大语系有很大的区别。 尽...

2019-04-02 21:23:54

阅读数 280

评论数 3

《自然语言处理实战入门》---- 第1课:自然语言处理简介

文章大纲个人简介自然语言处理简介1.Nlp技术体系简介1.1 基础技术1.2 Nlp 核心技术1.3 NlP+(高端技术)2.知名NLP 服务系统简介2.1汉语分词系统ICTCLAS2.2 哈工大语言云(Language Technology Platform,LTP)2.3 Amazon Com...

2019-04-01 22:25:53

阅读数 148

评论数 0

大数据ETL实践探索(6)---- 使用python将大数据对象写回本地磁盘的几种方案

文章大纲python 与hdfs 交互 回写python2 与hdfs在python中直接调用hadoop shell 命令去操作文件python 与 py4j 交互pyspark 直接写文件到磁盘(这个可以搭建一个本地的spark 单机版试试)python docker 搭建spark stan...

2019-04-01 09:51:09

阅读数 100

评论数 0

NLU(Natural Language Understanding)太难了

原文链接:https://github.com/fighting41love/hardNLU NLU is hard!!! 一直关注刘群老师的微博,常常看见他分享的一些好玩的#自然语言理解太难了#。 遂整理了NLU实在是太难了系列语句,大家一笑无妨。这里列举了一些关于分词、实体识别、知识图谱相关...

2019-03-07 12:27:11

阅读数 249

评论数 0

做项目一定用得到的NLP资源

原文链接:https://github.com/fighting41love/funNLP 最近需要从文本中抽取结构化信息,用到了很多github上的包,遂整理了一下,后续会不断更新。 涉及内容包括:中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、...

2019-03-07 10:08:12

阅读数 518

评论数 0

技术调研----OpenResty高可用技术初步探索

安装说明 http://www.runoob.com/w3cnote/openresty-intro.html If you are using Amazon’s EC2 to host OpenResty, remember to install the development tools th...

2019-03-06 10:59:21

阅读数 94

评论数 0

使用IsolationForest 与Meanshift算法进行异常检测

数据加载 Meanshift 聚类

2019-03-03 12:39:20

阅读数 165

评论数 0

技术调研----BI工具对比及Surperset 之 docker安装与可视化

BI 技术选型对比 kibana Tableau Superset redash FineBI Google Data Studio 官网链接 https://www.elastic.co/products/kibana https://www.tableau.com/ http...

2019-03-02 01:22:47

阅读数 529

评论数 3

数据可视化的开源方案: Superset vs Redash vs Metabase (一)

叶剑烨 叶剑烨的个人注释 2018-01-17人是视觉动物,要用数据...

2019-02-22 00:59:56

阅读数 86

评论数 0

印度称抖音导致该国年轻人“文化堕落”,给封了。

源 / 顶级程序员   文 / 江户川雨抖音导致“文化堕落”作为近两...

2019-02-22 00:59:56

阅读数 189

评论数 0

AutoML与机器学习领域的理解

作者:一人 Featuretools如你所言能够自动完成特征工程,它属于AutoML范畴,接下来我还是主要谈AutoML1吧。由于机器学习应用高门槛和应用范围的广阔,所以很多组织于2017和2018年开始自动化的机器学习尝试,想降低机器学习应用的门槛,让非专业人员也能够应用。机器学习的工作流通常...

2019-02-18 00:31:49

阅读数 933

评论数 0

指纹的对比分析系统概述

摘要:指纹识别技术作为生物识别技术中最为具有应用前景的技术之一,近年来取得了长足的发展,并广泛应用于各种场合。由于指纹所具有的唯一性和不变性,以及指纹识别技术具有很高的可行性和实用性,指纹识别成为目前最流行、最可靠的个人身份认证技术之一。所以对指纹识别技术的研究具有重要的理论和实际意义。 指纹识别...

2019-02-14 20:33:49

阅读数 2547

评论数 4

Hadoop 3.x 新特性剖析系列1

1.概述  目前从Hadoop官网的Wiki来看,稳定版本已经发行到...

2019-02-13 15:39:08

阅读数 120

评论数 0

大数据ETL实践探索(5)---- 大数据ETL利器之 pandas

文章大纲文件加载一些参数的解释索引的那些坑杂项jupyter notebook 显示所有行和列 文件加载 path = r'./data/ren_pd.csv' df_pifu = pd.read_csv(path,low_memory=False,dtype={'MBR_NO':np.str...

2019-02-03 23:51:57

阅读数 954

评论数 2

As time goes by

完成于2014年年初 文章大纲1.影评2.经典3.成长! 每当新年,我都在这里为你祝福,也在这里为你剖白。 剖白是为了沟通,沟通是为了理解,理解是为了共识,共识是为了共行。 此时此刻,你我虽远隔千山万水,然你却横跨五湖四海,不远万里送上一赞, 我受此大恩,定然不能让你失望。...

2019-01-01 11:22:49

阅读数 379

评论数 1

我所理解的生活!

无码的睁大眼睛看,有码的眯起眼睛看,没有情节的直接删除 ----这就是我所理解的生活! 写于:2013-7 我也许能够一直打着寻找自我的幌子,继续在这个社会招摇撞骗。凭良心说我喜欢千奇百怪的结果,于是这个刚刚走出校园的...

2019-01-01 11:21:18

阅读数 6631

评论数 3

草稿2013

温和的坚持,并且傻笑。 ----------题记 一,综述 期末将至,来点文字祭奠一下过往,也算年终总结了。记忆回滚至九月,轻车熟路的再入吃饭大学,这么多熟人,好像文理的主场呦。微信摇了很多妹子,而且居然有印度和南非的,可能三步走战略的打开方式不对,于是没有一个靠谱的。男童鞋云集了一...

2019-01-01 11:18:00

阅读数 359

评论数 0

提示
确定要删除当前文章?
取消 删除