nlp学术研究
欢迎来到月度功能的第二部分,我将探讨在数字人文科学中如何使用开源软件和开源方式。 每个月,我都会介绍可用于数字人文研究的开源工具以及当今正在使用开源工具的人文研究项目。 我还将介绍有关透明度和开放交流以及如何将开放源代码方式的其他原理应用于人文科学的新闻。
让我们从对数字人文科学的解释开始。 数字人文学科是传统人文学科奖学金(或艺术,语言,历史等方面的学术研究)进入数字时代的地方。 通过以新颖和创新的方式使用技术,数字人文学科的学者可以创建研究项目,以计算机之前不可能(或非常费力的工作)的方式探索主题。
文本/数据挖掘,可视化,信息检索和数字出版是数字人文科学研究的一些关键特征。 使用计算机,可以相对轻松地分析文本,发现模式并可视化数据。 例如,数字人文项目可以使阅读和分析成为一项协作任务,就像Infinite Ulysses项目对James Joyce的小说Ulysses所做的那样。
3月,发布了一些有趣的新软件和教程。 我在下面重点介绍了其中最有趣的部分。 也许您会在自己的数字人文研究中激发您的灵感,或者帮助您了解这一有趣的学术研究领域。
4个新工具和教程
使用Twine 2.0讲互动故事
在《高等教育纪事》的ProfHacker博客上 ,Anastasia Salter分享了Twine 2.0如何在教育中使用。 Salter 向读者介绍了这种对初学者友好的开源工具,用于创建交互式分支故事。 对于初学者来说,Twine非常容易,非常适合K-12教室,但它的功能也很强大,可用于创建交互式在线课程。
使用Twine,历史或文学叙事可以轻松地转换为互动的,自己选择的冒险故事。 读者可以通过积极参与叙事并做出影响自己经历的选择来学习。 每个分支的选择都可能导致读者走上不同的道路,从而使他们能够体验不同的故事,并在每次演练中学习新的细节。
Twine在网络浏览器中运行,因此请签出在线版本或下载并在本地运行您自己的副本。
Omeka的新版本改善了可访问性和可用性
Omeka是功能强大的内容管理系统,专门用于创建学术性的文本,音频和视觉资源集合。 最新版本Omeka 2.3于3月10日发布。该最新版本具有一些新功能 ,但是其中一些主要增强功能是在可访问性和可用性方面。 Omeka已经易于使用,但是新的增强功能将使工作流程更好。
如果您从未使用过或听说过Omeka,请查看Omeka展示柜以查看使用Omeka构建的项目,或者尝试使用Omeka Sandbox进行示例安装。 如果您喜欢所看到的内容,则可以从Omeka网站下载Omeka和大量附件 。 如果您不想托管自己的安装,则可以选择Omeka.net(具有免费和付费付款计划的托管版本)。
使用Neatline创建视觉材料的交互式版本
弗吉尼亚大学图书馆的学者实验室发布了Neatline的更新, Neatline是一个Omeka插件,用于创建可视化材料的交互式版本。 借助Neatline,学者可以创建围绕地图,绘画,文字扫描页面或类似物品构建的交互式展览。 除了基本的Neatline插件外,还有一些扩展— NeatlineText,NeatlineSimile和NeatlineWaypoints —提供了更高级的功能。
Neatline无需过多的技术知识即可创建精美的交互式展览。 浏览Neatline演示 ,查看许多使用Neatline和Omeka可以完成的出色示例。
使用Textures.js设计SVG模式以实现数据可视化
在可视化数据时,重要的是要确保可视化既可理解又在视觉上具有吸引力。 一种出色的实现方法是使用Textures.js(一种用于创建SVG纹理的新JavaScript库)。 Textures.js可以创建不同颜色和图案的纹理,从而使可视化的数据清晰易懂。
Textures.js建立在强大的D3.js库之上,该库是一个JavaScript库,用于“基于数据操作文档”。 D3.js有一个GitHub Wiki ,其中包含大量有关如何使用它可视化数据的示例 。 您还可以在Wiki的教程页面上找到大量的教程和书籍。 下次您想创建高质量的可视化文件时,请查看D3.js和Textures.js,我认为您会对结果感到满意。
这是关于开放式数字人文科学状态的每月专栏。 如果您想分享与该主题相关的新闻,请发送电子邮件至Joshua Allen Holm 。 如果您想发表有关该主题的文章,请将您的意见发送给Opensource.com 编辑团队 。
翻译自: https://opensource.com/education/15/4/open-source-digital-humanities
nlp学术研究