动力小说

三数据可视化方法的简介(第1页)

天才一秒记住【动力小说】地址:https://www.dlchuwuqi.com

三、数据可视化方法的简介

banner"

>

上文中介绍的文本分析的方法主要用于搜集和分析数据,而社会网络分析的工具主要是运用在对关系型数据的分析中。

对研究者而言,除了搜集、分析数据之外,另外一件很重要的工作就是用通俗易懂的方法将研究成果展示给读者。

除了需要给读者展示研究成果之外,如果使用了恰当的方法将数据进行可视化的处理,还便于研究者自己对原始数据有一个感性化的认识,从而更容易发现新的现象和规律。

因此,数据的可视化是大数据的工具包中很重要的一个元素。

广义来说,数据可视化的方法就是用一些便于人们接受的简单“信号”

来展示和提炼数据中关键信息的办法。

这里的“信号”

可以是一些具体的数字,也可以是颜色、长短、面积大小等。

无论是人文学科还是社会科学,使用数据可视化的方法是新的发展趋势之一。

尤其是在数字人文相关的研究中,数据可视化方法可以帮助优化数据结构的展示,使得相关的信息更加直观。

恰当地使用数据可视化方法,可以使得数据和研究展示更加直观,更容易让受众接受,不仅帮助了读者,有时也能帮助研究者本身加深对现象的理解,提供更多元化的视角。

“此外,大数据可视化分析与传统统计分析的区别在于它的动态性,其数据容量、内容及更先进的处理方法都使得动态可视化分析成为可能。

目前不少软件可用于可视化分析,海杜普(Hadoop)即是一个比较成熟的可视化软件,能够对大量数据进行即时处理,淘宝、百度等大型商业网站就利用海杜普来完成每天数以亿计的访问量数据存储、查询统计以及用户行为分析等。

美国环境系统研究所(EemsResearstitute,ESRI)在开源网站基哈伯(GitHub)上共享了‘海杜普地理信息系统工具’(GISToolsforHadoop),用户可以利用其对上亿条空间数据记录进行过滤和聚合操作,在报告中嵌入大数据地图进行发布。”

[30]

数据可视化的方法和其他大数据的方法密不可分。

以“词频分析”

为例,它是大数据文本挖掘中很重要的一种研究方法,同时它也是一种文本可视化的模式。

在对我国古代文学作品的研究中,重要的一个元素是词汇。

而对古代文学作品中词汇特征的理解和分析主要是通过词频进行的。

词频分析就很大程度上取决于古代汉语中如何分词。

“古代汉语的词汇有一个长期的从单音节词向双音词及多音节词演化的过程。

古代汉语在词汇和语法等诸多方面与现代汉语不同,尽管现代中文信息处理技术已经在很多领域取得了快速发展,然而这些研究成果主要针对现代汉语,现代汉语已有的分词研究成果并不能完全照搬到古代汉语分词领域中。”

[31]

除了词频分析之外,地理信息系统的分析工具也处在大数据空间分析与数据可视化方法的交叉地带。

以文学发展以及文论特征对社会文化发展的影响为例。

如果通过结合文本分析和统计回归分析的方法发现文学的特征对社会文化发展的影响随着区域的不同而有差异,那就可以通过可视化的方法,把这个结论在电子地图上展示出来。

可以用不同的颜色来区分不同地区的不同的作用大小。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

穿越后,我和夫君一起重生了都市最强天师神宠进化深渊主宰逃荒:她从空间掏出千万物资神秀之主掌御星辰偷香高手这个人仙太过正经网游之盗版神话麻衣道祖恐怖女主播麻衣神算子不良之年少轻狂不败战神离婚后前妻成了债主剑域神帝从亮剑开始的特种战凶灵秘闻录牧神记妙手小村医神诡世界,我有特殊悟性高武:我有一个合成栏科普精灵:最强宝可梦教父炮灰攻略