网页剪藏

陈华 ⋅ 2021-09-19

经常在网上看到令人拍案叫绝的文章,见猎心喜之下便想着保存到本地,占为己有,以免某一天变成了 404(已经见怪不怪了)。曾经用过一个网页剪藏工具,名字忘了,只记得它可以聚合网页,却不能阻止源网页的消亡。后来转用印象笔记,它的剪藏功能着实不错,也方便编辑。而且印象笔记功能完善,是优秀的个人知识库,我为此还充了七年的高级会员。不曾想,印象笔记变得臃肿不堪,广告也频繁出现,哪怕是会员也无法避免,这实在是令人作呕。无奈之下,我投向它的开源替代品 Trilium Notes。这个软件既可以在本地运行,也可以搭建在服务器上,支持高度定制,虽然复杂,却也实用。而且它的剪藏功能丝毫不弱于印象笔记。因此,我兴致勃勃地搭建服务器版本和安装浏览器扩展,大半年下来,确实感受到了便利和自主。可随着不断地深入使用,我的需求越来越苛刻,而软件的维护也变得繁琐。虽说工欲善其事必先利其器,我却早已陷入了工具的“正确性”,初心不再,本末倒置。

一番醒悟之后,我不再苛求全面和完美。我把需求简化为将网页剪藏到本地,易于保存、编辑和转移。于是,我很快找到了一个简单实用的浏览器扩展 MarkDownload,它支持火狐、谷歌和 Edge 浏览器,可以一键将网页剪藏成 Markdown 格式,并把图片保存在独立的文件夹里,不依赖于数据库。我将所有的剪藏文件存放在同一个文件夹里,结合 Typora 编辑器的文件树和搜索功能,简直了!

我的 Typora 图片设置如下:

Typora 图片设置

为了与其一致,我对 MarkDownload 设置了图片路径,即右键扩展图标,选择扩展选项,将 Image filename prefix template 设置为 {title}.assets/,并勾选了后面的 Pure Markdown。此外,勾选 Append front/back template to clipped text,自动添加原作者信息和网页链接等版权内容。

MarkDownload 虽然好用,但也有两个问题。一是,它只支持 Markdown 格式,因此对于网页中较复杂的表格就无能为力了。解决办法是,右键网页,选择查看页面源代码,复制表格部分的 HTML 代码,粘贴到 Markdown 文件中。看似繁琐,实际上也很少会遇到这个问题,所以也无关紧要了。二是,这个扩展只支持 .jpg 格式的图片,即剪藏后的 Markdown 图片格式为 ![](folder/image.jpg),因此可能需要手动修改后缀,才能显示图片。

所谓窥一斑而见全豹,由上可知,我走了很多弯路,也迷失了本心。或者说,太顾着面子,反倒忘了里子,实在是太不应该了。就如这个博客,换过三个域名,折腾了许久的样式布局,却没有写成几篇文章,有什么用呢?且洗去浮躁,沉下心来,做一件事罢。