- 博客(4)
- 资源 (2)
- 收藏
- 关注
原创 安全数据集和开源工具
由于本人从事安全相关的行业的工作,接触到很多想用机器学习解决网络安全相关的问题,不可避免的需要用到很多安全相关的开源数据集和工具,这里记录一下本人自己用过并感觉不错的数据集和开源工具。当然,这可能只是安全领域数据集和开源工具极小的一部分,希望能起到抛砖引玉的目的吧,本人后续也会不断更新。 1. 安全数据集 对于安全数据集,已经有行业从业者不辞辛劳的总结的很完善了,这里给出两个我看到的...
2018-07-12 14:48:22 5438 5
原创 自然语言处理之知识图谱
1. 引言 最早接触知识图谱是在一篇分析人工智能的文章,文章提出一个很有意思的观点:“在感知层面,人工智能进步很大,在更高级的认知层面,我们现在了解的仍然很少。” 我对这句话的粗浅理解是,人工智能在学习数据的内在表示(无监督学习),或者对数据的输出结果判别方面表现出了强大的能力,甚至在计算机视觉、语音识别、机器翻译等方面接近或超过人类的表现水平,但这些都还停留在对数据内容的归纳和感知层面,对...
2018-07-12 10:38:29 40100 9
原创 机器学习之特征工程
1. 为什么做特征工程 我们学习编程语言时被告知程序=数据结构+算法,那么对于机器学习,我认为也可以类比为机器学习=大数据+机器学习算法+运行平台。面对一个机器学习问题,一般有两种解题思路:传统机器学习算法或者深度学习算法。一般而言,传统机器学习需要的样本数量相对少、算法运行快、内存开销小、算法的运行和部署难度小,但困难是对数据的表示:特征工程,也可以形容为沙里淘金;而深度学习算法,可...
2018-07-10 15:42:33 3391
原创 机器学习的性能优化方法
1. 引言最近看吴恩达深度学习的深度学习课程笔记,笔记公布网站:https://github.com/fengdu78/deeplearning_ai_bookshttp://www.ai-start.com。看到第三门课:结构化机器学习项目,看完很有感触,感觉大牛确实是牛,比自己当初做项目单独摸索时使用的方法强太多,自己当初也能按照这些方法做就好了。为了以后自己少走弯路,将课程中好的执行...
2018-07-09 17:23:50 1762
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人