杨秀璋的专栏

无知 · 乐观 · 谦逊 · 低调 · 生活

中文知识图谱研讨会的学习总结 (上) 图谱引入、百度知心、搜狗知立方

        知识图谱(Knowledge Graph)是当前学术界和企业界的研究热点。中文知识图谱的构建对中文信息处理和中文信息检索具有重要的价值。中国中文信息学会(CIPS)邀请了有约10家从事知识图谱研究和实践的著名高校、研究机构和企业的专家及学者有意参与并发表演讲,下面就是第一届全国中文...

2015-11-16 02:16:48

阅读数:30765

评论数:18

Python简单实现基于VSM的余弦相似度计算

在知识图谱构建阶段的实体对齐和属性值决策过程中、判断一篇文章是否是你喜欢的文章、比较两篇文章的相似性等,都涉及到了向量空间模型(Vector Space Model,简称VSM)和余弦相似度计算相关知识。这篇文章主要是先叙述VSM和余弦相似度相关理论知识,然后引用阮一峰大神的例子进行解释,最后通过...

2015-11-18 05:40:46

阅读数:22530

评论数:3

程序人生:无他,唯心向尔

这是自己这段时间拒掉一些offer和面试,决定回家当一名大学老师后的感触!有时候觉得啊,程序员不仅仅应该只是编码、学习和工作,更应该感受下这个世界、学会生活,希望文章能让你体会到一些东西,如果有不同的见解,还请海涵~

2015-11-10 03:20:23

阅读数:3692

评论数:12

[Python爬虫] scrapy爬虫系列 <一>.安装及入门介绍

前面介绍了很多Selenium基于自动测试的Python爬虫程序,主要利用它的xpath语句,通过分析网页DOM树结构进行爬取内容,同时可以结合Phantomjs模拟浏览器进行鼠标或键盘操作。但是,更为广泛使用的Python爬虫框架是——Scrapy爬虫。这是一篇在Windows系统下介绍 Scr...

2015-11-08 04:22:10

阅读数:8711

评论数:3

神经网络和机器学习基础入门分享

最近在做知识图谱实体对齐和属性对齐中,简单用了下Word2vec谷歌开源代码。本文主要讲述了机器学习的一些入门知识以及神经网络的基础概念,同时引入了很多例子进行讲解。 机器学习方法是计算机利用已有的数据(经验),得出了某种模型(迟到的规律),并利用此模型预测未来(是否迟到)的一种方法。人工神经网络...

2015-11-03 05:16:35

阅读数:9815

评论数:2

[笔试题目] 美团2015年9月后端开发工程师笔试题

面试职位 应聘职位:基础研究 岗位描述:探索和创新前沿互联网技术,将高新技术转化为产品,参与腾讯产品的开发与技术实现 岗位要求:2016年毕业,自然语言处理、多媒体、分布式网络、数据分析、智能计算、安全等互联网相关技术具有较深研究和专业积累,具有较好的创新能力和编程开发能力,具备较强的团队合...

2015-11-01 23:51:45

阅读数:5873

评论数:6

提示
确定要删除当前文章?
取消 删除