自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

albertyzy的博客

大数据,机器学习,自然语言处理

  • 博客(9)
  • 收藏
  • 关注

原创 深度学习笔记

记录一些看过的比较好的深度学习文章。深度 | 从修正Adam到理解泛化:概览2017年深度学习优化算法的最新研究进展 机器之心翻译的Sebastian Ruder的blog概览深度学习中的五大正则化方法和七大优化策略 知乎专栏,也是机器之心要点:正则化避免参数数量多于样本数量的模型过拟合,有助于泛化。而增加样本数量也可以防止过拟合。防止过拟合还可使用数据增强、L1 正则化、L2 正则化、Dropo...

2018-07-04 22:05:57 254

转载 大数据处理系统学习笔记(二)之Hadoop

这次总结一下hadoop的相关知识点,主要参考了以下三个链接第三章:Hadoop的一些基本概念分布式计算框架Hadoop原理及架构全解Hadoop基本原理和维基页面Apache_Hadoop,MapReduce现在常见的有三大分布式计算系统:Hadoop,Spark和Storm。前两个由Apache开发,后一个由Twitter开发。Hadoop使用硬盘存储数据,数据持久性强但是受硬盘读写速度影响数...

2018-06-19 16:09:46 430

原创 Linux的Awk文本处理工具笔记

最近刷Leetcode时发现awk真是一个非常强大的工具,在shell编程里要几十行搞定的内容用awk一行就搞定了。先贴几个awk的guide链接留作备份防止以后找不到。第零个就是强大的Wikipedia,Awk,维基百科上就自带了很多例子和解释,在最后的参考文献里也能找到有用的链接。第一个是酷壳——AWK 简明教程,这个简明教程很强大,从一个文档的实例入手然后逐步讲解各个知识点,边讲解边处理,还...

2018-06-11 16:55:49 466

转载 Linux命令大全(转)

在cnblog上发现一个很强大的博客,介绍了很多Linux命令Linux常用命令大全(非常全!!!)还有一个网站可以随时查找Linux命令Linux命令大全再附赠一个vim的Cheat Sheet Vim Cheat Sheet...

2018-06-08 10:54:09 185

原创 初试Python爬虫下载pdf

最近刚学完Boyd的Convex Optimization,真是对Boyd神佩服得五体投地。在他的lecture slides末尾发现原来还有进阶课程Stanford的ee364b,那本convex optimization只包括了ee364a,然而ee364b没有现成的完整slides一次性下载,只好写个爬虫挨个下载保存slides,在ee364b里的内容更加专业深入,估计实际很少用到。然后我把...

2018-06-02 14:08:45 7246 3

原创 文本关键词提取小结

网上看到一篇文章总结了几个关键词抽取的算法(如何做好文本关键词提取?从达观数据应用的三种算法说起),想到这是一个很重要的课题还是有必要小结一下的,有不足之处大家可以讨论讨论还有几个比较好的链接供大家参考中文分词原理及工具中文分词工具测评自然语言处理入门(4)——中文分词原理及分词工具介绍大体上关键词抽取算法分三种:有监督(二分类问题,需提供大量标注好的训练数据),半监督(提供少量的有标注的训练数据...

2018-06-01 11:22:24 11418

原创 Anaconda安装pygame

首先确定anaconda中pip的版本conda list安装加更新各个packageconda install pip现在的pip版本是10.0.1Proceed([y]/n)? 选y需要等待一会儿完成package的更新,等待时间依网速而定接下来使用pip安装pygamepip install pygame一般会碰到 The read opera...

2018-05-31 19:20:01 32266 12

转载 分布式账本平台比较(转)总结

参考链接是对比以太坊、Hyperledger Fabric和Corda参考文章中的表1对三个分布式账本技术(DLT,distributed ledger technologies)框架的总结十分完整,本文只总结要点。原文章最后的参考文献很有价值三个DLT简介以太坊(Ethereum):开源的有智能合约功能的公共区块链平台,数字货币是以太币(Ether),提供decentralized的Ethere...

2018-05-31 18:05:22 3156

转载 大数据处理系统学习笔记(一)

参考链接有[实操演练] 大数据架构:flume-ng+Kafka+Storm+HDFS 实时系统组合Flume+Kafka+Storm+Redis构建大数据实时处理系统:实时统计网站PV、UV+展示菜鸟教程之Redis教程数据采集(Flume) => 数据接入(传输)(Kafka)=> 流计算(Storm) => 数据输出与可视化(MySQL)Flume(http://flume...

2018-05-31 14:02:35 1295

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除