天才一秒记住【动力小说】地址:https://www.dlchuwuqi.com
第一节“数字人文”
简介
banner"
>
“数字人文”
(也称“数位人文”
,或“数码人文”
)的研究随着数据科学的出现和繁荣应运而生。
“数字人文”
是一个将现代统计学、数据科学、计算机等技术应用于人文学科研究的跨学科研究领域。
在过去的10年当中,新的数据搜集、处理和展示的方法不断出现,对人文学科的发展起到了极大的推动作用。
大数据的方法对社会科学领域,如政治学、社会学、经济学的影响要早于人文学科。
而大数据(搜集、处理和展示)的方法对人文学科,尤其是中国文学和文艺学研究的影响,也是最近一两年才出现的。
所谓大数据并不一定是指数据的规模大,若数据的搜集和分析的过程需要比较复杂的计算机算法,也可以称为大数据的方法。
一般而言,运用大数据进行的人文社会科学的研究有以下五大特征:“(1)超大规模数据。
大数据力图分析全数据,通常指TB级别以上的数据量。
(2)数据类型多样化。
大数据蕴含了文本、图片、视频、音频、邮件、交易信息、社交网络信息等结构化、非结构化数据。
(3)数据流动速度快。
大数据善于管理和分析动态变化的数据流。
(4)大数据蕴含了丰富的时空信息。
(5)大数据是贫矿,价值密度低。”
[1]
“数字人文”
是伴随着大数据方法的出现而诞生的新兴交叉学科,主要是将要处理的人文相关信息进行数字化处理,转化成数据科学较易操作的电子文本信息,如格式化数据、图像、自由文本等,从而对这些电子化的数据进行计量分析(包括文本分析与检索、地图可视化等)。
随着数据科学的不断进步,“数字人文”
的边界也在不断拓宽,其方法也在不断变化和发展。
借助计算机语言或者算法,当研究者知道自己所研究的项目具体需要从哪些文本搜集数据的时候,“数字人文”
的工具箱可以较快地给我们提供高效的搜集数据的方法。
当然,“数字人文”
的研究不只是将文献电子化,并以简单的书库集的形式给部分学者公开使用。
广义的“数字人文”
包含了那些搜集、处理和展示人文研究相关的数据的方法和工具。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!