发布日期:2023-09-01 01:43浏览次数:
一种解释:如果让我来定义,我认为它是以人文问题为目的、以电子信息技术为手段的问题解决方案。
在这个例子中,涉及到了词语的检索,中英文遇到了各自不同的问题,英文中,不同的词有不同的形式,同一个词进行变化会改变其词性。而在中文的角度——怎样算是一个“词”?比如“数位人文”按照语义应当拆分为“数位”和“人文”,而“位人”则没有任何意义。详细的解决方法暂不赘述,从这个例子中我们可以看出语言(文字)是连接计算机和人文的内容媒介,同时也可以意识到中国的数字人文研究必须要有对中华文化和汉语深刻理解的人来完成。
第二个例子则是一种由定量到定性的分析,通过大量的数据来得出较为确定的结论。其实,这有些像当下正火的“大数据分析”。
第三个例子较为复杂,它更多的是语言学方面的研究,理解起来有一定的难度。(ViaDHQ 2016.10.4Language DNA: Visualizing a LanguageDecomposition)下面我作大致解释:该研究团队将英语的全部单词计入,每个单词拆分为两个字母一组,分别对应到x轴和y轴,进而用颜色的深浅(点的密集程度)来表现词语的构成。
他们将其称作L-DNA。然而对于其具体应用,论文中并没有有力的解释。尽管从这些可视化图形中,我们可以直观地分析出语言学方面的结论,譬如特定的音素会有规律地放在特定的位置。换言之,可视化的方法仅仅是方便数据的获得,并不会直接产生突破性的结论,而后者的有无则要靠人文学者的智慧。
L-DNA空间能够处理从空字符串到无限长字符串的任何符号串。L-DNA可用于1,2或n维。
在空间中的任何两个点(单词)之间,L-DNA空间是无限的,存在另一个单词
L-DNA空间是一对一的(双射)。每个独特的编码映射到唯一的位置,反之亦然,可以从视觉空间中唯一地恢复单词(或任何原始信息)。
根据其结论3,我们可以采用这个编码方式,借助合适的实体媒介(比如生物材料),来保存我们的语言。当然,以中文为代表的的象形文字则需另辟蹊径。
通过三个实例,我们容易发现数字人文并没有固定地研究对象,即一切人文学科甚至泛人文学科皆为其研究对象,并且数字化的方法也是多种多样。
关于数字人文的话,个人认为它跟自然语言处理还是有区别的。未来若跟人工智能算法结合也是很有趣的事情。然而国内目前似乎很少有研究室在搞...丧。
我这个回答是两三年前的了,很多信息可能陈旧了些,总的来说随着deep Learning在cv上日趋饱和,nlp也逐渐开始找新的田地了,哈哈哈哈。这个回答应该也没必要继续更新了,因为信息越来越对称了,希望国内这个领域能慢慢做起来!
补充一下相关教学项目的信息。欧美大学的数字人文专业普遍强调数理基础,核心课程包含大量大数据、机器学习等内开云体育 开云官网容。以下是一些典型的顶尖大学DH研究生项目。
*注:学杂费1750欧元(约合13800元人民币)一年;KU Leuven连续四年问鼎路透社欧洲最佳创新大学榜
数字人文:没有准确的定义,个人也不建议做定义。后面说的几个定义都有道理,但个人并不建议局限在量化计算或者大数据上,数字人文包含的内容要多得多。
但实际上,DH和文献学(philology),尤其是与数字/文本编辑(digital/textual editing)有很大关系。姜文涛的“对撞机|数字人文文学研究与近代文学的兴起 ——以北美文学研究学科史为中心的文献学考察”(上中下)是一篇比较详细的介绍文章。而在这里我想推荐的一门“入门”书(很重要,但我也不敢说很简单)是Jerome McGann的Radiant Textuality: Literature after the World Wide(Palgrave Macmillan,2001)。这本书折磨我很久,但确实给了我很多启发。文本性(textuality)是个很重要的概念,能够上下衔接1960年代的后结构主义到1980年代的hypertext,下能衔接digital archive和DH,实际上是一个非常重要的概念。Jerome是一个传统的人文学者,但自觉的转向了digital scholarship,在这个过程中,做了大量的文本标注、存档和转化的过程。这个其实对于很多传统的人文学者都有非常好的借鉴意义,同时也向大家展示了DH的多样性和深入性。DH并不只是量化或是炫技,还可以更深入地去改变人文研究的基础——文本。这个方面的延续阅读,推荐Matthew G. Kirschenbaum的Mechanisms:New Media and the Forensic Imagination(The MIT Press,2012)。
此外,如果从数字文化的角度考虑,其实还包括了数字档案、数字媒介研究、数字博物馆和遗产、电子文学等等。更“不要脸”一点说,可以包括一切和数字有关的人文问题。当然,这么说,也就把这个概念的有效性降低了。但总体而言,目前阶段,不定义就是好定义。
最近数字人文的公众号做了不少,清华大学的“DH数字人文”、人大的“数字人文资讯”,当然还有“零壹Lab”,感兴趣的可以直接关注下。
然鹅,最近还是有点担忧的,主要是在看论文的过程中,发现了一些纯在概念上捣浆糊的文章,不免有些担心。毕竟,学术界除了产出粮食,也喜欢糟蹋东西。常见把一个好题目好领域做烂掉的情况。但愿DH不会是下一个。
我在EPFL时,选了digital humanities的课,本以为水一水,结果惊奇的发现这个方向还蛮有意思的
在我看来,这个方向就是将一些历史文化文献通过电子化的方式存储,以更生动形象的方式把历史和文艺呈现给大众
欧盟提出了一个叫做欧洲时光机的计划Homepage Time Machine Europe,想要把欧洲所有城市至今为止的历史以电子化的方式保存,以更好的visualiztion的方式呈现给大众。
其中最开始最著名的威尼斯时光机计划由EPFL完开云体育 开云官网成 ,学校当时想把威尼斯的历史变迁以3D形式还原出来,具体到每开云体育 开云官网一年每条街道每本文化古集,这个视频Videos里面有已经完成的一些效果。在EPFL ArtLab有更具体的展现。
数字人文概念是信息化的产物,是大数据技术等发展的背景下,人文学科发展的需求呼唤的 产物。
简单说,就是用数字化的方式和手段来研究人文,而人文可以作为是社会科学学科的代称。放大了说,可以说是用研究自然科学的方式研究社会科学。也就是把信息化的手段用来研究人文地理历史甚至哲学各种。
Barrett认为数字人文指利用计算机技术处理,通过分析传统人文研究资料,并将人文学科方法论与计算工具相结合而进行的人文研究,如互动映射项目和历史文本数字化[参考文献1]。潘雪[参考文献2]认为,数字人文是数字计算机技术与人文学科的交叉,利用多种计算工具与方法(如数据挖掘、可视化等)拓展艺术、历史、文学研究等多领域人文学科的研究。
另外,为了加深理解,摘抄 潘雪老师《国外高校数字人文课程设置结构分析——以iSchools联盟为例》中的一段话:
在大数据时代与数据密集型研究范式的背景下,数字人文作为一种新的科研方向,对数据的处理不再局限于传统理工类学科的研究过程,也逐渐渗透到人文科学研究中,为人文学科的研究打开新思路。数字文本的大量产生和纸质文本的数字化为计算机文本处理提供基础材料支撑。在以传统感性为主的人文学科研究基础上引入理性技术手段,将定量分析与定性分析融为一体。
在实践方面,国外如美国、英国等均建立多个数字人文中心,开展多个数字人文项目;国内如武汉大学和中山大学积极尝试数字人文中心的建设。在理论方面,国内数字人文的相关研究发展迅猛,有从数字人文的角度研究古籍文献数字化和可视化;也有通过数字人文的相关技术分析历史、地理信息;还有学者通过分析国内外数字人文实践经验,探讨图书馆在数字人文中心建设中的作用,以及如何更好地将数字人文与图书馆服务相结合。但是,目前对数字人文教育相关的研究较少。数字人文的研究不同于其他人文学科或理工学科的研究。数字人文领域作为交叉学科,既需要研究人员具备人文学科的研究思路,掌握相关学科知识和具有一定的学科背景,也需要熟练掌握相关计算机技术,并且可以思考如何利用这些技术进行人文学科的研究。
[1] 张舵,吴跃伟.国外图书馆支持数字人文的实践及启示[J].图书馆杂志,2014(8):47-52.
[2] 潘雪《国外高校数字人文课程设置结构分析——以iSchools联盟为例》