数据科学家修炼之道读后感 读后感大全最新

征文网 2022年3月3日读后感评论86 阅读2097字

大数据时代到来,数据科学与大数据技术逐渐成为一个火热的名词。各行各业都在讨论着大数据,利用着大数据。那么,到底什么是大数据,什么又是数据科学呢?《数据科学家修炼之道》这本书用幽默风趣的语言告诉我们答案。

本书不仅介绍了数据科学家应该具备的素质与基本知识,也向我们展示了数据科学家的养成之路。读罢本书,各种各样的计算机名称可以算是“乱花渐欲迷人眼”,比如第五章《技术资质》中提到的“R”“SPSS”“SAS”“Hadoop”“Hive”等数据分析专业知识,让我感觉头昏脑胀。

我虽然对于书中提及的技术知识实在难以消化,但是确实也学到了很多知识。比如大数据的4V特性、“数据准备”“数据探索”等数据科学的处理流程,这些科普性解说让我对当今流行的大数据技术与大数据处理流程有了比较清晰的认识。

档案是信息的一部分,数据也是信息的一部分,在阅读时,我不免尝试从档案学的角度来思考一些问题。档案数据、档案大数据也是近些年火热的研究问题,甚至从中衍化出档案文化数据等新名词,这些都是档案学与数据科学积极接触的产物,这些接触无论是对档案学本身,还是对于我们这些档案学的学习者来说,都是一次机遇与挑战。

一、美梦与陷阱:量与质的分析

“很自然地,这种规则的变化带来了人们在处理相关项目时的方式,如何参与亟待解决的问题,以及如何以从业者的身份使自己成长。”

——《数据科学家修炼之道》

大数据与数据科学的发展不仅带来了对象的变化,也带来主体的变化。数据科学的运用本质上是一种新的思维模式的运用。

大数据是大体量、多样化、高速化、精确化的,要处理这样的数据,就不能采用传统的质的分析的思维,应该采取量的分析模式。技术的进步改变了以往只能处理“小数据”的状态,使得数据存储、处理与分析技术产生了质的飞跃,科学研究方法论也发生了质的转变。

一方面,档案工作可以运用数据科学与数据技术,去研究如何创新档案数据开发利用的服务模式。借助档案网站的用户大数据,分析用户的关注点与兴趣点,并为档案服务提供发展方向与新的思路。

另一方面,档案作为数据的一部分,确实也可以参与到大数据与数据科学的研究之中。档案的“数字化”向“数据化”方向的转型就是这种新的思维模式的成果。

“档案数据”或者“档案大数据”的提出既是因为电子文件的发展带来档案概念的“模糊化”,也是因为档案从业者探索档案在数字时代如何发挥新的作用。管理大数据需要的系统思维,利用相对“碎片化”的档案也同样需要这种思想。这些变化使得档案能够在这个时代发挥出更大的作用,“智慧档案馆”等新的服务方式证明了这一点。

可以说,数据科学与学科专业结合成为驱动学科发展的新路径,档案数据作为新时期档案学的研究对象,不仅是数据化的结果,也是再数据化的基础,推动着档案学进入科学共同体。

但是,数据科学似乎为档案数据管理的发展编织了一场“美梦”,但如果沉醉于“虚幻的美梦”中,实践就会在不知不觉中掉入数据科学与档案数据管理的“夹缝”。

正如上文所说,大数据与数据科学不仅带来服务业态的转变,也带来人们思想模式的变化。

大数据,重数量轻质量,这个是因为大数据的逻辑基点是“数据”。而档案工作不能只是重数量轻质量。因为档案的逻辑起点是“档案”或“文件”,尽管这个概念在“大档案观”的影响下有所变化,但其本质依旧不能够改变。

一方面,不是所有的数据都是档案,或都是档案数据;另一方面,质的研究分析依旧不能缺少。

就像《档案数据内涵与特征探析》一文指出“从内涵上看,档案数据首先属于档案信息,具备档案性质,满足档案的所有基本要求。”如果我们完全采用大数据的思维模式与工作思路,我们就会掉进这种学科交叉的陷阱,丧失档案的独特性,甚至会导致档案工作出现问题。

二、琼楼玉宇:修炼数据的悲欢

“但在这之后,当处理实际问题时,由于双方基于各自的可行性考虑(例如把之前提到的资源限制纳入考虑),所分析以及持有的信息不同,就仍有可能会产生一些有关于项目落实方法上细微的不同想法。”——《数据科学家修炼之道》

自从2015年国务院印发《促进大数据发展行动纲要》以来,大数据与数据科学与专业教育也越来越有交叉,近些年所提倡的新文科建设更是强调将包括大数据在内的信息建设融入文科建设之中。

图情档教育的本质和核心价值是培养“信息”,为人类社会提供专长于数据、信息和知识的记录、保存、组织、检索、获取、分析与开发利用思想、方法及技术的人才。因此,我们学习大数据技术与数据科学的相关技术是非常必要的。

但是,从这本书的学习中,我也能够得知,如果以我们文科出身,或者偏重文科的学生去掌握非常精炼的数据技术,是很困难的。

那么对于我们来说,什么是最重要的呢?

我记得我的老师在课堂上说过,要我们成为“提要求的人”,而不是当一个成熟的数据科学家。

就像《数据科学家修炼之道》这本书提到的一样,不同的专业领域的运用需要不同的专业知识。当我们与这些数据科学家接触时,如果我们什么都不懂,那么我们也就无法提出精确化的要求,这样会导致项目出现各种各样的问题。

所以,我们应该努力去了解相应的技术,明白都存在哪些技术,大体上都可以做到什么样子.

这样,我们才能做好一个“提要求的人”。

继续阅读

公众号:pcren_cn(长按复制)

匿名

发表评论

匿名网友