【工具】数字化文献管理与学术研究

  (本来是一篇作业)

  互联网时代,数字化变革已经影响到各个行业领域,中文、历史等学科,有着长期扎在故纸堆里的研究传统,古籍数字化与文献数据库的建立很大程度上方便了了行业的研究,但对于个人学术管理和研究行为的改变还处于初期阶段。个人的学术研究,很重要的一点就在于长期的积累,并且在积累过程中不断生产个人的独特认知。在学术研究中,我整理出以下环节:
  发现选题——文献搜集——文献整理——文献阅读——思考笔记——研究输出
  特别是从文献到笔记,在长期沉淀过程中,还需要管理不断壮大的个人文献库以及阅读过程中生产出的读书笔记和研究灵感。汉代目录学思想的萌芽或许也跟秦火之后,当时人们征集各方文献所面临的现实有关。面对数量庞大、学说关系复杂零散的典籍,急需一个行之有效整理思路,于是产生了不同的分类法。然而古时实体文献的制作、流通都比较不易,好学之人想要获得想要的典籍需要付出很多,在管理和保存上也需要下很大功夫,《庄子·天下》云:“惠施多方,其书五车”,就反映了惠施的博学和收书之多。但是由于古籍文献的物质存在形态,使得博学者要么是有一定的机缘,比如刚好是国家藏书机构的管理员,要么就是有一定的社会财富,家境殷实,比如明代著名藏书家项元卞,才可以支撑起来浩如烟海的古籍收集和管理,才能够在学术路上有所成就。
  生活在现代的我们在书籍文献获取上则方便了很多,并且有大量的数字化资源可以从各种渠道获取,收集一套《四库全书》更不必要专门建立一座藏书室,但是这也仅仅是省下了整个研究过程中的初始阶段。如何安全的管理自己的文献库,如何便捷的访问自己的文献库,如何清晰的分类,以及如何整理产出的笔记和学术成果,则是我们如今要解决的重点。
  我的方案是这样:
  一, 以云盘为中心,配合本地磁盘备份的存储方案。
  二, 结合图书分类法,定制适合个人研究领域的整理方案。
  三, 基于多端同步功能的的文献阅读和笔记管理方案。

一、以云盘为中心,配合本地磁盘备份的存储方案

  为什么要依靠云盘作为存储管理的中心?
  如今互联网行业云服务竞争激烈,各大巨头都在推出云服务、云应用,大型企业和公司都在数据上云,因为在未来数据上云是一种趋势。从普通消费端看,我国的互联网基础设施建设愈发完善,越来越多的家用宽带逐步从百兆升到千兆,手机 5G 更是发展迅速,网络成为我们生活的一部分,只要网络够好,云盘与本地的区别并不是很大,但是云盘的便利和安全是本地单一存储不能比拟的。下面就以我使用的 OneDrive 为例谈一谈文献存储。
  OneDrive 是微软公司的云盘产品,免费用户有 5G 的云空间,Microsoft 365 订阅用户有 1T 的云空间,Microsoft 365 基于云平台提供多种服务,通过将 Word,PowerPoint,Excel 和 Outlook,OneNote 等应用与 OneDrive 和 Microsoft Teams 等强大的云服务相结合,让任何人使用任何设备随时随地创建和共享内容。对于大部分个人用户来讲,主要是使用 OneDrive 提供的云服务。由于是微软自家的产品,在 Windows10/11 系统中有很好的支持,直接整合在了文件资源管理器中,并且右下角工具栏也会实时显示同步状态。

  如图,以我的 OneDrive 云盘为例,在文件资源管理器中,储存在 OneDrive 上的文件共有四种状态,它们分别对应:在云端(如 ArrowBackup 文件夹)、全部本地可用(如 Design 文件夹)、部分本地可用(如 Office 文件夹)、正在同步(如 Software 文件夹)
  在云端(如 ArrowBackup 文件夹):该文件夹所有文件储存在云端,需要下载后再使用。
  全部本地可用(如 Design 文件夹):该文件夹所有文件已经下载到本地,可直接使用。
  部分本地可用(如 Office 文件夹):该文件夹部分文件已经下载到本地,可直接使用。
  正在同步(如 Software 文件夹):该文件夹有文件正在同步到云端。
  OneDrive 的好处在于,作为微软自家产品,与 Windows 生态无缝融合,可以很方便的在文件资源管理器中进行管理,并且编辑云盘内的 Word,PPT,Excel 文件都可以实时同步,在其他设备可以继续编辑或者查看。同时,可以设置把文件“始终保留在此设备上”,即使网络中断也不影响文件离线使用,待网络恢复后就可以继续同步。这样也就相当于云端与本地的双备份,只要储存在 OneDrive 上的文件,都可以在有网络的情况下随时获取,PC、手机都可以访问,即使没有网络,PC 离线使用也不影响。我想过能让这个使用模式崩溃的可能情况,无外乎这么几种:不能使用任何 PC 或者智能手机、微软倒闭、一直停电、一直断网、世界末日。
  云盘服务器的安全性方面也是一大考虑,微软长期服务于重要企业和政府部门,有着良好的信用记录,个人用户是微软云业务中的一小部分,不会对用户存储内容随意修改、审查、锁定,这一点是很多国际互联网公司的优点。所以不担心出现像百度网盘、WPS 的一些产品出现的恶性事件,万一有重大事故出现,也可以离线打开电脑,将个人文件安全转移。
  但 OneDrive 并不是毫无缺点,最大的缺点就是在国内很多地方下载速度不稳定,慢的时候几百 K/s,通常在几兆每秒。不过由于上传满速、不限流量、可以始终保留在本地,正常使用对于下载的问题可以接受,一般提前挂上同步,基本不会影响使用。这也仅仅是国内网络环境的问题,期待未来改善。
  依据这种模式,国内其实还有类似的替代产品,例如坚果云。坚果云的使用逻辑与 OneDrive 类似,并且是国内公司,不会存在下载速度问题,但让我放弃主力使用坚果云的原因是其专业版太贵,而且云空间太小,只适合轻度文件同步,其他的使用体验挺好。
  如果是苹果用户,iCloud+MAC/iPad/iPhone 的组合是最佳搭配,但是 iCloud 的资费也不便宜。不过 OneDrive 在 MAC 也能用,生态体验会差一些。
  如果对云盘服务不放心,可以尝试家庭 NAS,这是最理想的解决方案,但是搭建费用会很高。
  另外,对于体积更大,数量更多的文件,OneDrive 商业版容量更大,基础 5T,最高可扩容到 25T 的解决方案。但是我会更偏向于另外的解决途径:如果使用频率较高,就为这类文件单独加装仓库硬盘;如果这类文件的使用频率不高,同时不是敏感文件,就放到阿里云盘或者百度云盘。

二、结合图书分类法,定制适合个人研究领域的整理方案

(1)整理原则

  解决了数字文献如何安放问题,下面谈一下数字文献的整理。整理的基本原则有这样几个:定期整理、格式统一、科学命名、避免重复。
  有再好、再干净的房子长期不打扫也会变得脏乱差,所以每隔一两个月,或者有赶上大量的文献转入,就要进行文献的整理,这样可以方面文件查找。
  整理的第一步,统一文件格式。我始终认为,一个标准化、统一化的协议是降低使用成本,提高使用效率的最佳方案。下面就是所以我会尽可能把所有诸如 PDG/UVZ/DJVU/CAJ 格式文件转换为 PDF,这个步骤一定要在一开始存入文件时候就做,否则到积累数量太多的时候,就会十分麻烦。为什么转换为 PDF?因为可以方便其他设备阅读,PDF 是最广泛、支持最多的格式,尤其是扫描书籍,平板和手机无法支持 PDG/UVZ/DJVU/CAJ。同时,因为各类笔记软件对 PDF 支持的最好,也可以为我们后面的文献管理、阅读、批注提供巨大便利。其他的 Word,PowerPoint,Excel,TXT,Markdown 等文本文件就不过多要求,而且这类文件一般体积不大。
  整理的第二步,科学命名。文件命名有很多情况,每个人习惯不同。但是有几个方面我觉得可以通用。
  1、排序。一方面是对文件夹依据重要程度或者类型给予阿拉伯数字或 ABC 排序分类。另一方面,要注意文件命名排序,例如一般操作系统都不支持中文一、二、三数字排序,尤其当收集到一些成套的丛书,所以最好将中文数字转换为阿拉伯数字,可以使用菲菲更名宝贝。
  2、时间+内容。这是最通用的项目类文件命名方式,例如“20220808 读《中国目录学史》”。
  3、避免文件名过长。文件名过长会遮挡一些信息,所以要么把作者、书名等内容提前,要么删去无意义内容。
  4、同一级文件夹下文件名统一。出版时间、作者名字、书籍分类等,最好同一级文件夹下有一个统一的命名规则。
  整理的第三步,避免重复。一开始面对大量的数字文献,很容易让人无所适从,并且很快发现,收录了许多重复的资源。这就需要我们从一开始就要尽可能避免重复收入,减小文献库空间压力。
  以上三步中查特殊格式文档、查文件、查重复都可以借助 Everything 软件,总之,减轻后续工作麻烦的最佳原则是:一开始养成良好的使用习惯。

(2)分类原则

  迄今,人类已经发明了许多种图书分类,针对中国古籍的有六分、四分,现代常用的有杜威法、美国国会图书分类法、中图法等等,但是,我们不是准备开公共图书馆,这些分类法对于个人来讲体系过于庞大,并不适用。尤其是对于专门化、模式化、单一学科背景的研究者来说,如果硬套中图法,很容易就会发现我们的文献库只能填进零散、割裂的几个小类当中,这样不连续、逻辑断裂的分类方式并不会有助于我们的学习研究。所以最好根据个人学科研究的实际情况,进行图书分类。可以借鉴这些图书分类法,总体的原则应当基本遵循经典分类体系:
  1.在属种概念之间进行,每级划分只能有一个标准。
  2.子项外延之和等于母项的外延,否则划分不全或多出子项。
  3.划分出的概念不能为相容关系,属种概念不能并列。
  当然实际操作过程会有很多不确定的情况,只能根据个人喜好,怎么方便怎么来。
  例如我的常用文献库这样分类:
  ├── 1 版本目录文献 ├── 2 宗教文献 ├── 3 敦煌文献 ├── 4 十三经
  ├── 5 诸子 ├── 6 诗文集 ├── 7 史部文献 ├── 8 文字音韵
  ├── 9 三代研究 ├── 书画名物 ├── 地图表格 └── 大家全集
  但是不常用文献库就这样分类:
  ├── 全集丛书├── 出土文献├── 史书古籍├── 报刊杂志└── 杂七杂八
  诸如二十六史、四库全书、儒藏道藏之类的文献就会归入“史书古籍”中,这个不常用文献库接近 1T,另外还有一些资源放在云盘,只在用到的时候再检索下载。
  又或者 epub 电子书我这样分类:

  总之,要根据个人需要制定自己的图书分类方案。

三、基于多端同步功能的文献阅读和笔记管理方案

  理清楚文献怎么整理,就进入文献阅读和笔记产出环节。子曰:“学而不思则罔,思而不学则殆”,古代夸人读书读得好往往会评价“博闻强识”,但是现在单靠脑子记是不行了,俗话说不动笔头不读书,但在文献数字化、管理云端化的现在,有着大量的软件工具选择,就可以减少手写笔记,既方便管理查阅,又不怕丢失,只需要我们输出笔记就好。

(1) 阅读 PDF——BookxNote Pro

  BookxNote 是一款国产软件,对 PDF 阅读支持很好,当然 Acrobat 和福昕对 PDF 的开发历史悠久、更专业,但是从用户角度来讲,我需要的是一款可以方便阅读、批注、笔记输入的工具,而不是天天制作 PDF。
  BookxNote 优势在三方面:
  一、笔记本的管理。建立自己的笔记分类,同时对多本书进行阅读做笔记。
  二、阅读和笔记同步整理。边阅读,一边画重点,随时调整笔记脑图的逻辑结构,构建自己对书本的知识体系,做到把书本从厚读到薄。
  三、笔记和其他软件协同。当把一本书读完后,就需要把所有的知识进行归类整理,软件提供导出笔记数据到各种格式(支持图片,ANKI,HTML,xmind,opml),方便整理,复习,和知识的输出,实现把书本再从薄到厚的过程。

  这也是我为什么一开始就强调统一文献格式的另一个重要原因,基于 BookxNote,可以实现所有 PDF 数字文献的阅读、批注以及笔记输出,操作逻辑简单直接,十分符合国内操作习惯。同时,软件也支持笔记数据云端同步,使用了 OneDrive 或坚果云,就可以在另一台设备同步阅读进度和笔记批注(需要在书籍也同步的情况下)。
  抛弃知网研学是其太臃肿复杂,不使用 zotero 则是因为其逻辑更适合理工医学学生,BookxNote 兼容性更强,适用范围也广,并且有着安全可控的数据同步方案。

(2)摘录与笔记——OneNote

  我把日常摘录和常用笔记放在 OneNote 上。
  经常看到比较好的公众号文章或者网页文章,想要保存下来,OneNote 就很方便。只需要公众号关注“微软云笔记”,绑定微软账号,看到好的公众号文章,只需要复制链接给公众号就可以了。保存网页,只需要 chrome 或者 edge 浏览器安装 onenote web clipper 插件,绑定账号,看到喜欢的网页文章只需要点击插件,选择剪辑“文章”即可。印象笔记也有这样的功能,但是印象笔记不免费啊。而且因为前面也都使用微软的产品,选择 OneNote 理所当然。
  记笔记也是一样,OneNote 的笔记功能也十分强大,并且移动端集成了便签功能,可以同时同步 OneNote 和微软便签。根据网络环境不同,不同端同步时间可能比较长,甚至需要手动刷新。

四、总结

  以上就是我日常学习中,对于数字文献管理、阅读和笔记的基本流程,这一套流程实际上都是依赖微软 OneDrive 的云同步作为底层支撑,由于很多人都长期使用微软的产品(windows/office),所以不会影响使用习惯,也可以在确保了数据安全的同时,方便在手机端查看、检索、编辑、搜集。
  我相信在互联网的时代,每个行业领域都会在数字化浪潮中逐渐发生变革,适应变革,学习新工具为我所用,提升生产学习效率,是对于个人尤其是计算机领域之外的人,值得付出一些努力去学习尝试的。

✈ 最后更新: 2022-08-20
  • 版权声明: 本文为原创内容,本博客版权声明文章谢绝私自转载!
  • Copyrights © 2020-2024 w _ k
  • 访问人数: | 浏览次数:

请我喝杯咖啡吧~

支付宝
微信