保护你最重要的研究数据,这四件事做起来

保护你最重要的研究数据,这四件事做起来

国务院在四月时发布了《科学数据管理办法》,要求科学工作者将研究数据储存到国家数据库,确保科学数据安全,就连欧盟也在考虑实施数据保护相关法规。数据安全的选择是如何影响我们的研究生活的?巧合的是,我在写这篇文章的时候,一个也在读博的朋友打了电话给我,告诉我一个恐怖的故事,她的同事把五年间得到的研究数据存在硬盘中,但不小心把硬盘给搞丢了,现在完全找不到!

关于研究数据,这里有个真实案例告诉你,出事了会怎么样:

数据丢失案例

很明显的,学术殿堂也聚集了各种关于数据丢失还有数据管理不良的恐怖故事,让这些受灾户几乎要放弃读博,或是看数据能救回到什么程度,再调整原来的研究方向。如果你是物理学或是医学研究生,实验室可能就是你的数据库,如果你是人文或社会科学领域的博士生,你可能会有个存满音频、视频和转译稿的硬盘。

虽然每个研究员都会想要相信自己的数据是安全的,但这很有可能不是事实。我们在读博期间,经常太过专注在打怪,争取下一个基金,或是争取评等分数,导致有时候忽略了研究过程的根本:数据。在一个研究项目上投入几年的时间,需要持续升级资源,最终创造丰富的数据库,得出各种可能的成果。这种时候,要能成功完成手边的研究项目,管理研究数据是必不可少的一环,本文带你了解研究数据管理的关键要素。

告诉你为什么要好好保护数据

对于研究来说,数据是推断意义的媒介,是研究质量和诚信的展现。因此,有效的数据管理应该是每一个研究员都要注意的事。大学纷纷开始设立数据管理系统,让他们的学者可以储存、取得和运用数据。

负责任地管理数据可能是破解科研目前最大的问题之一,也就是不可重复性的关键。有效管理注册数据,用合适的形式储存数据,都能让数据使用更加多样化。科研人员可以将从不同方式搜集而来的数据用在不同地方。还有,这能将不同人所搜集到的同一批数据的层次区隔出来。这个数据能否被取得,是确保科学能重复的关键要素。

接下来,有效的数据管理可以保护数据不丢失,对研究成果和出版物产生深远影响。对我朋友的同事来说,要重做原本进行顺利中的研究,得再花上好几年的时间!

研究可取得性:未来的关键

取得方式是数据管理的重要面向,因为这代表着是否能在既有研究的基础上发展,还有挖掘尚未开发的领域的可能性。施普林格自然先前所作的调研显示:“超过 70% 的参与人员都认为,未来所有的研究论文、学术专著和研究数据都应该以开放获取的形式供人取得,有 91% 参与的图书馆员认为‘开放获取是学术科研出版的未来’。就这方面来说,科研界中的各个相关团体越来越强调,不只要有责任地储存数据,还要让数据容易地被取得。”

技术公司和善心投资者现在也有诸多针对研究员的应用和服务。像 MendeleyReadcube  Endnote 这类的应用软件能储存和引用文字数据,文字数据是社会和人文领域研究的大宗,也可以补充自然科学和物理学中的阅读和注释。

很多时候,单位或实验室可以取得的数据需要分享给也在做相同项目的人跟第三方。现在也有开放数据的声浪,呼吁科研人员选择将数据开放获取,或是放在共享获取平台上。

识别码和资料库在今日被广泛使用,更加有效地管理数据,使用这些的好处有:

  • 保护研究:识别码和资料库可以设定访问点和访问权限,既能让人取得,又能避免让不想的人看到。
  • 可以宣传数据:识别码和资料库可以让科研人员提供路径,根据分类来宣传自己既前沿又新颖的研究。
  • 方便提供访问路径:如同上一点所提,识别码和数据库可以让数据集有一个固定的访问路径,更方便使用。

数据也可以根据新收到的要求重新布置,现在有大量但质量不见得好的研究,宣传自己的研究更显重要。使用识别码和资料库不只能够给自己的研究一个身份,还可以确保你的研究安全地储存在一个地方。这些工具或平台既能让人看到浏览研究数据,还能进行各自的隐私设定。

管理珍贵的数据,你该这么做

具体的数据管理计划开始出现在资助文件、赞助记录还有重要官方文件中,因为这是研究可靠度的指标,可重复的承诺。根据这个现况,这里有一些在管理研究数据时你该做的事:

  1. 尽可能的将数据存到云端,使用云端服务提供商的个人账户,或是学校的数据管理系统,这都可以降低数据丢失的风险。
  2. 将数据整理成容易找到也容易使用的形式,这可以提高你 的数据被找到的机会,特别是数据是公开或是分享出去的状态。标准化数据集成为许多资助合同的新宠儿,着眼于国际最佳实践。一定要注意软件应用的优势,储存、分类和格式化你的数据。
  3. 你可以选择让你管理的数据开放获取,目前对数据保存和汇集有比较多的宣导和特别关注。
  4. 养成每天储存新增数据的习惯,以有组织的方式进行管理,分类、格式化并存放在容易找到和取得的空间。

数据经常被称为研究员的金矿,这不是随便说说。研究数据是庞大投资的结果,这其中有金钱,有时间,还有资源的投入,因此安全存放数据,提高被取得性,是科研进步的关键。然而,数据管理对科研人员来说一直是个挑战,不管在科研生涯的哪个阶段都是。让更多人意识到数据管理的重要性是接下来科研界要做的事。

你对数据该怎么管理和取得有什么想法?欢迎留言分享你的看法、观点以及经验。

意得辑专家视点相关推荐阅读:

期待学术生涯高歌猛进,发表过程一帆风顺?

来加入我们活力洋溢的在线社区吧。免费注册,无限阅览。

社交账号一键登入

已有54300名科研人员在此注册。

觉得有用?

如果是的话,和你的同事分享吧

该话题属于开展研究阶段

身为科研人员,开展研究是最先也最令人兴奋的一步,如果你正处在这个发表阶段,欢迎订阅学习这个阶段该知道最佳实践,为成功发表铺平道路。