Calibre-web 个人图书库搭建记 11 扩充图书库

因为calibre-web服务器环境目前基本稳定了,所以自己开始考虑如何进行图书墙的数据扩容问题了。前段时间因为需要下载图书,开通了小蜜蜂书库的vip,自己每天抽空把下载权限给用上,每天可以新增到书库50本新书,去掉重复的部分基本可以达到30本,一个月能新增1000本。一年能新增一万本图书,应该也能服务不少用户了。

小蜜蜂的书库基本都是正版书籍,在排版和质量上都能有所保障,之前的一部分图书是从其他网站下载的,很多不是亚马逊的版本。这几天我对重复图书的处理是不重复添加,现在想来应该重复添加才对,这样可以将原来非官方的图书版本更新掉,逐渐实现图书质量的提高,反正上传不花钱。只不过是重新覆盖一下。然后通过 calibre的插件 Find Duplicates 处理重复图书。

小蜜蜂的vip只需要30元每年,对于电子书资源来说性价比超高。但下载权限的限制也很明显,一天只能存储50本,一天只能下载20次,下载还有频率和带宽限制,好在打包下载速度还可以,一般50本下载下来需要20多分钟,不能一起下载,一次一个进程下载比较安全。

下载完导入本地数据库,转换相应的书籍格式,转换过程是最消耗机器性能的时候,转换epub和mobi两种格式,epub负责在线阅读,mobi负责发送到kindle,这样不需要进行在线转换,可以节省一点服务器性能,相应的就是浪费磁盘空间,目前看很快要超出腾讯云的50GB免费空间了。这需要自己考虑一下是不是要清理一下服务器上的文件,每个文件只保留一种格式。但节流只是第一步,第二步应该是考虑开源了,想到好的盈利模式才是正事。

本地数据导入后,基本不需要整理标签和作者,正版标签就是给力。处理完后将新增的图书通过腾讯云对象存储的本地同步工具同步到服务器上。然后将metadata.db 数据库文件传到服务器目录。重新加载数据库检查文件是否更新成功。

前几天因为觉得自己网上找的这些图书标签质量和作者、出版社都受到太多污染了。很多书籍被各个网站倒手多次,meta属性信息都带有广告,标签也乱七八糟。把标签进行了大量的删减后只剩下了一小部分标签、后面还想着继续优化标签规范,宁缺毋滥的态度去处理这些影响体验的问题。

囤积这么多书籍自己肯定是看不完的,那囤来肯定是要与人分享的,最近看到很多人在拿着Kindle看书了,也许这个设备的占有率正在逐步提升。一次书籍的收纳和贡献即将开始。


这一系列文章并没有什么具体的技术细节,开了个QQ交流群(72239907),方便大家交流读书、技术问题、图书资源共享。如果有什么软件安装等问题也可以加 calibre 交流群的QQ群(72239907)进行交流。
点击链接加入群聊【爱读书 读好书 calibre】:https://jq.qq.com/?_wv=1027&k=5vYWQsV