自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

段智华的博客

热烈祝贺王家林大咖2018年清华大学新书《SPARK大数据商业实战三部曲》微信公众号:从零起步学习人工智能 ,欢迎关注访问!...

原创 2020年重磅喜讯!热烈祝贺王家林大咖大数据经典传奇著作《Spark大数据商业实战三部曲》 畅销书籍第二版 清华大学出版社发行上市! 前浪致 Spark + AI 后浪
原力计划

王家林大咖清华大学新书Spark第二版已上市:致 Spark + AI 初学者前言新书介绍编辑推荐内容简介作者简介精彩章节新书目录第二版前言第一版前言Spark+AI学习路径献给Spark+AI的“后浪”新书案例讲解第二版网购链接新书资讯 前言 欢迎来到清华大学出版社《Spark 大数据商业实战三...

2020-05-25 11:08:23 184 0

原创 2020年重磅喜讯!热烈祝贺王家林大咖大数据经典传奇著作《Spark大数据商业实战三部曲》 畅销书籍第二版 清华大学出版社发行上市!
原力计划

《Spark大数据商业实战三部曲》第二版购书链接: https://item.jd.com/12864870.html

2020-05-22 16:27:07 323 3

原创 2018年新春报喜!热烈祝贺王家林大咖大数据经典传奇著作《SPARK大数据商业实战三部曲》 畅销书籍 清华大学出版社发行上市!

2018年新春报喜!热烈祝贺王家林大咖大数据经典传奇著作《SPARK大数据商业实战三部曲》畅销书籍 清华大学出版社发行上市! 本书基于Spark 2.2.0新版本,以Spark商业案例实战和Spark在生产环境下几乎所有类型的性能调优为核心,以Spark内核解密为基石,分为上篇、中篇、下篇,...

2018-02-13 19:47:15 5116 9

原创 cs224u 树结构神经网络实现(5)

cs224u 树结构神经网络实现(5)sst_03_neural_networks __author__ = "Christopher Potts" __version__ = "CS224u, Stanford, Spring 2020" 树结构神经...

2020-06-02 21:38:34 41 0

原创 cs224u 监督情感分析:RNN classifiers PyTorch 实现(4)

cs224u 监督情感分析:RNN classifiers PyTorch 实现(4) __author__ = "Christopher Potts" __version__ = "CS224u, Stanford, Spring 2020" 在上一...

2020-06-01 20:41:13 54 0

原创 cs224u 监督情感分析:RNN classifiers(3)

cs224u 监督情感分析:RNN classifiers(3) 递归神经网络(RNN)是一种按顺序处理输入的深度学习模型,本文使用RNN分类器。 对于长度为n的序列: 其中1⩽t⩽n,如上图所示,隐藏状态序列初始状态用h0表示,在我们的实现中是一个0向量,但可以用更复杂的方式初始化...

2020-05-31 21:07:33 41 0

原创 cs224u 监督情感分析:IMDB representations(2)

cs224u 监督情感分析:IMDB representations sst_03_neural_networks(2) __author__ = "Christopher Potts" __version__ = "CS224u, Stanford, Sprin...

2020-05-29 21:27:37 64 0

转载 热烈祝贺王家林大咖清华大学新书《Spark大数据商业实战三部曲》第二版上市!...

2020-05-22 16:16:15 30 0

原创 Linux hanlp JVM 部署及libstdc++.so.6部署小技巧

Linux hanlp JVM 部署及libstdc++.so.6部署小技巧 Hanlp部署JVM Linux 系统库部署 Hanlp部署JVM ,提示找不到'/usr/lib/jvm' (python36) [centos@host33 cnn_rnn]$ sudo ...

2020-05-22 14:12:40 65 0

原创 Linux Python 及Sudo Python Flask 导包小技巧

Linux Python 及Sudo Python 导包小技巧 问题:使用python执行脚本,写入日志文件无权限;提权使用sudo python找不到包。 (python36) [centos@host33 cnn_rnn]$ python flask_server_cleanup_m...

2020-05-21 15:46:02 71 0

原创 Linux+Docker+Tensorlfow 部署探索

Linux+Docker+Tensorlfow 部署探索 Tensorflow官网链接https://tensorflow.google.cn/install/docker Docker部署 Tensorflow部署 Docker部署 卸载旧版本 [centos@host32 ~]$ ...

2020-05-20 20:51:42 61 0

原创 Linux 环境部署|Anaconda及Tensorflow

Linux 环境部署|Anaconda及Tensorflow Linux系统python虚拟环境及HanLP部署(https://duanzhihua.blog.csdn.net/article/details/105046407) Anaconda部署 Tensorflow部署 Anaco...

2020-05-20 20:49:52 76 0

原创 cs224u 监督情感分析:稠密特征表示与神经网络(1)

cs224u Supervised sentiment: dense feature representations and neural networks __author__ = "Christopher Potts" __version__ = "CS224...

2020-05-14 21:04:11 114 0

原创 cs224u sst_02_hand_built_features Wrapper for LogisticRegression

cs224u sst_02_hand_built_features Wrapper for LogisticRegression 上一篇博客(https://duanzhihua.blog.csdn.net/article/details/105981617)我们讲解了BasicSGDClass...

2020-05-11 21:42:09 66 0

原创 MIT线性代数课-Gilbert Strang教授2020年新课程,用更短的时间实现Linear Algebra for Everyone. 强烈推荐大家学习。

MIT线性代数课-Gilbert Strang教授2020年新课程,用更短的时间实现Linear Algebra for Everyone. 强烈推荐大家学习。 2020新视野下的线性代数-A 2020 Vison of Linear Algebra ,课程主页:https://ocw.mit....

2020-05-09 12:19:51 271 0

原创 cs224u Supervised sentiment: hand-built feature functions

cs224u Supervised sentiment: hand-built feature functions 监督情感:手工构建特征函数 概述 •本文的重点是构建用于线性分类器的特征表示 。 •我们将在这里构建的功能的核心特性: ◾在非常大、非常稀疏的特征空间中表示。 ◾利用领域的专家人类...

2020-05-08 21:46:51 65 0

原创 cs224u Overview of the Stanford Sentiment Treebank

cs224u Overview of the Stanford Sentiment Treebank 本文有几个相互关联的目标: •针对长期以来一直是学术研究和行业应用核心的问题:情感分析,提供监督学习的基本介绍。 •探索和评估一系列不同的情感建模方法: ◾线性分类器手工构建特征函数 ◾...

2020-05-07 20:13:14 126 0

原创 cs224u Homework  PPMI+ LSA +GloVe+ Dice coefficient + t-test reweighting +subword information 

cs224u Homework PPMI+ LSA +GloVe+ Dice coefficient + t-test reweighting +subword information 本文包括以下内容: PPMI as a baseline Gigaword with LSA at dif...

2020-05-04 21:54:03 54 0

原创 cs224u Homework and bake-off: Word similarity

cs224u Homework and bake-off: Word similarity 单词相似度数据集一直被用来评估分布式表示。本文提供使用多个数据集进行此类分析的基线代码。

2020-05-03 21:40:55 152 0

原创 cs224u WordNet+Glove VSMs +Retrofit

cs224u WordNet Faruqui等人在三个知识图上进行实验:WordNet、FrameNet和 Penn Paraphrase Database (PPDB)。本文实现其中一个WordNet实验,其中图是基于同义词形成的。 ...

2020-05-03 10:58:30 60 0

原创 cs224u: Vector-space models: retrofitting

Vector-space models: retrofitting 概述 •到目前为止,我们词向量中的所有信息都仅仅来自文本中的共现模式。这些信息通常很容易获得——尽管人们确实需要大量的文本——而且令人吃惊的是,由此产生的表示形式是多么丰富。 •尽管如此,很明显,我们会错过一些重要的信息——那些...

2020-05-02 16:39:38 88 0

原创 cs224u word2vec词向量模型

cs224u word2vec 词向量模型 word2vec词向量模型从一个单词w预测与w共同出现的单词。这种直觉可以通过多种方式实现。在这里,我们回顾一下skip-gram模型,这是由Mikolov等人提出的,论文链接为https://papers.nips.cc/paper/5021-dis...

2020-05-02 08:52:19 89 0

原创 请读者关注智华的微信视频号

微信视频号“段智华”,视频号主要推广内容:清华大学出版社新书《Spark大数据商业实战三部曲:内核解密|商业案例|性能调优》第二版,新书在第一版本的基础上以Spark 2.4.3版本全面更新源码,并以TensorFlow和Pytorch为核心,新增加Spark+AI内幕解密篇的全新内容,大幅度增加...

2020-04-29 10:08:33 98 0

原创 Windows本地安装部署Spark及Pyspark

Windows本地安装部署Spark及Pyspark Windows环境安装配置 Pyspark 启动常见问题解决(系统找不到指定路径、Java gateway process exited before sending the driver its port number) 海报:业界AI...

2020-04-09 16:24:31 151 0

原创 cs224u Autoencoders自编码

cs224u Autoencoders自编码 业界AI课程分享,段智华邀你一起学习。本节分享课程:彭靖田,Google开发专家、华为深度学习团队核心成员,畅销书《深入理解TensorFlow》作者。 课程内容:1、快速掌握人工智能的理论基础与代码案例 2、4个典型人工智能模型实战,手把手教你...

2020-04-07 21:54:13 116 0

原创 王家林大咖10年时光雕琢出的1306页的大数据+AI新书立体书发布:《Spark大数据商业实战三部曲:内核解密|商业案例|性能调优》第二版 清华大学出版社即将印刷出版

2020-03-28 21:16:01 198 0

转载 热烈祝贺家林大咖10年时光雕琢出的1306页的大数据+AI新书第二版即将出版!

欢迎读者阅读!

2020-03-28 21:08:02 99 0

原创 Linux系统python虚拟环境及HanLP部署

Linux 虚拟环境部署

2020-03-24 15:30:10 214 0

原创 智华荣获2019年CSDN博客之星荣誉称号和证书!晒一波,与读者共勉!

智华荣获2019年CSDN博客之星荣誉称号和证书!晒一波~~~,与读者共勉!

2020-03-21 21:36:27 132 0

原创 Viterbi算法实战案例(天气变化、词性预测)

Viterbi算法实战案例(天气预测、词性预测) 人类活动与天气的预测 单词词性的预测 Viterbi算法图解笔记 人类活动与天气的预测案例 Viterbi.java的代码: package com.hankcs.book.ch01; /** * 维特比算法 * @auth...

2020-03-21 11:43:58 207 0

转载 2019年度CSDN博客之星TOP10榜单揭晓 智华入选TOP9!

培根说,『读书造成充实的人,会议造成未能觉悟的人,写作造成正确的人』。在短信短视频快速迭代的快时代,更深度的思考、更正确的实践,更成体系的写作与分享,尤显可贵。这里,每一...

2020-03-05 08:30:22 217 0

原创 数风流人物,俱在今朝!|2019年度CSDN博客之星TOP10榜单揭晓-智华非常荣幸入选中国博客之星TOP9,非常感谢大家的支持,愿和读者朋友们共同努力,坚持学习,让每个人都能实现自己的梦想!

培根说,『读书造成充实的人,会议造成未能觉悟的人,写作造成正确的人』。 在短信短视频快速迭代的快时代,更深度的思考、更正确的实践,更成体系的写作与分享,尤显可贵。这里,每一篇博文都是开发者实战的经验解读;每一个笔触都是技术人潜心修炼的知识凝练。在CSDN网站的博客频道,数万人长年在键盘后面笔耕不缀...

2020-03-04 21:26:33 1128 0

原创 王家林大咖新书预发布:清华大学出版社即将出版《Spark大数据商业实战三部曲:内核解密|商业案例|性能调优》第二版 及《企业级AI技术内幕讲解》

王家林大咖新书预告:清华大学出版社即将出版《Spark大数据商业实战三部曲:内核解密|商业案例|性能调优》第二版,新书在第一版的基础上以Spark 2.4.3版本全面更新源码,并以TensorFlow和Pytorch为核心,新增加Spark+AI内幕解密篇的全新内容,大幅度增加人工智能的内容及实战...

2020-03-03 20:05:56 324 0

原创 cs224u GloVe词向量方法

cs224u 向量空间模型之GloVe GloVe是Jeffrey Pennington 等作者于2014年提出的一种词向量方法,该方法基于全局词汇,通过统计单词共现的信息训练词向量,将统计信息与局部上下文窗口方法结合起来。 论文:Pennington et al. (2014) http:/...

2020-02-16 20:35:27 584 0

原创 cs224u 向量空间模型之降维(LSA)

cs224u 向量空间模型之降维(Vector-space models: dimensionality reduction) 降维的目的是消掉VSM中的相关性,捕获高阶共现,从而改善整体空间。例如,gnarly和wicked是俚语的经常出现的形容词,我们希望它们有一个良好的VSM相似性。然而,...

2020-02-15 13:23:56 682 0

原创 Pytorch+Google BERT模型(RoBERTa+LSTM+GRU)实战

Pytorch+Google BERT模型(RoBERTa+LSTM+GRU)实战 BERT(Bidirectional Encoder Representations from Transformers)模型的前置基础知识,读者可以参阅以下的文章: Pytorch使用Google BERT模...

2020-02-13 16:03:30 1360 0

原创 cs224u 向量空间模型之TF-IDF、子词信息及可视化

TF-IDF(term frequency–inverse document frequency): TF-IDF是一种用于信息检索与数据挖掘的常用加权技术,其中词频 (Term Frequency,TF),逆文本频率(Inverse Document Frequency,IDF)。 对于...

2020-02-11 21:40:13 499 0

原创 cs224u 向量空间模型之Distributional neighbors、Observed/Expected、PMI

本文讲解词向量中的分布邻居、观测值/期望值、点互信息PMI等内容。 Distributional neighbors(分布邻居): 对于给定的单词w,neighbors函数根据单词距w的距离(默认值:vsm.cosine),对词汇表中的所有单词进行排序。通过使用这个函数,可以了解距离函数的不同...

2020-02-09 19:55:26 414 0

原创 HanLP 部署及NLP+ML双生树思维导图

HanLP是面向生产环境的多语种NLP工具包,基于 TensorFlow 2.0,目标是普及学术界最前沿的技术到工业界。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。内部算法经过工业界和学术界考验,配套书籍《自然语言处理入门》。 安装部署HanLP: 登录Pytho...

2020-02-08 10:22:48 427 0

原创 cs224u 向量空间模型 Vector-space models

向量空间模型:设计、距离、重赋权重 本课程讲解矩阵设计,相似性评估,以及矩阵重新加权的方法。我们可以将单词和短语表示为实数向量。为什么要构建分布式表示?有很多潜在的原因。在本课程中,我们将强调两个方面: 理解上下文中的单词:单词数据丰富的表示方法,对于语言学家们使用自然语言词典有价值,对于社会...

2020-02-08 10:17:45 340 0

提示
确定要删除当前文章?
取消 删除