开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署

开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署

开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署-寻找资源网
开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署
此内容为付费资源,请付费后查看
5
立即购买
您当前未登录!建议登陆后购买,可保存购买订单
seekresource@163.com
1919588043
QQ1919588043
寻找资源网
微信小店:活生好美
付费资源
商城已上线,快去看看吧!

PDF 工具很多,但真正让人犹豫的,往往不是功能够不够,而是文件要不要上传。BentoPDF 的思路很直接:把 PDF 处理尽量留在本地浏览器或自建环境里完成,功能够用,部署也不重。

这类痛点,很多人都遇到过

合并文件、删除页面、加水印、压缩体积、扫描件 OCR、导出图片,这些都是很常见的 PDF 操作。平时用得少还好,一旦频率高了,就会特别依赖工具。

问题在于,很多在线工具虽然方便,可只要文档里带客户资料、合同内容、内部方案,上传这一步就容易让人不放心。公司内部尤其明显,大家更希望有一套自己可控的 PDF 处理方式。

那有没有一款工具,既能用,又不用把文件交出去?

最近看到一个开源项目:BentoPDF

它主打的一件事很实在:很多 PDF 处理动作直接在浏览器里完成,文件不需要先传到第三方服务器。如果你想自己掌控,也能很快搭一个内部 PDF 工具站。

图片[1]-开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署-寻找资源网

图片[2]-开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署-寻找资源网

这个项目能干什么

功能覆盖挺全。常见的 PDF 合并、拆分、旋转、提取页面、删除页面、加页码、加水印、裁剪、压缩、加密解密,这些都有。

再往上一层,它还支持 OCR、表单填写、书签管理,以及 PDF 和图片、Word、Excel、PPT、Markdown、JSON、CSV 之间的互转。

它还有一个比较加分的点:支持工作流处理。像“合并 + 加水印 + 压缩 + 导出”这种重复动作,可以串成一条链,省掉很多重复点击。

这个项目为什么值得关注

我觉得 BentoPDF 值得看的地方有三个。

一个是隐私友好。很多处理逻辑跑在客户端,文档不会默认先传到外部平台。

一个是能力完整。它不是只能做基础拆分合并,而是把编辑、转换、OCR、安全处理这些高频需求都放进来了。

还有一个是部署轻。如果你想自建,直接跑官方镜像就行:

docker run -p 3000:8080 ghcr.io/alam00000/bentopdf-simple:latest

一条命令起来,就是一个可访问的私有 PDF 工具站。

技术架构和部署方式

前端部分采用 Vite + TypeScript + Tailwind CSS。更关键的是,它把一部分复杂处理能力放到了 WASM 侧,配合 PyMuPDF、Ghostscript、CoherentPDF 这类模块完成 PDF 操作。

简单理解,就是把原本更偏本地软件或服务端的能力,尽量搬到了浏览器里执行。

在部署上,它除了 Docker,也支持静态部署到 Vercel、Netlify、GitHub Pages 或普通 Nginx。对内网团队来说,它还支持离线或空气隔离部署思路,这一点很实用。

前端和后端怎么理解

这个项目的前端不只是展示页面,而是真正承担了不少处理逻辑,所以它更像一个“浏览器里的 PDF 应用”。

后端反而不重,常见部署更多是静态站点或容器服务承载页面和资源,这也是它上手门槛不高的原因。

开源协议要注意什么

BentoPDF 采用的是双许可证模式:开源部分是 AGPL-3.0,另外提供商业许可证。

如果只是学习或按开源方式使用,一般问题不大;但如果准备闭源集成到自己的产品里,就要重点看 AGPL 对代码开放义务的要求,商用前最好先确认清楚。

即刻体验一波,适合哪些场景

它很适合几类场景:公司内部搭一个 PDF 处理门户;售前、实施团队临时处理客户资料;内容团队做资料归档、打印排版、小册子输出;还有对文档隐私要求更高的内网环境。

如果你最近正想找一个能私有部署、功能又比较完整的 PDF 工具,这个项目很值得跑起来试试。

图片[3]-开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署-寻找资源网

图片[4]-开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署-寻找资源网

图片[5]-开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署-寻找资源网

图片[6]-开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署-寻找资源网

图片[7]-开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署-寻找资源网

图片[8]-开源|一款隐私优先的 PDF 工具箱,支持编辑、转换、OCR,还能私有部署-寻找资源网

还有更多功能待你来发现。

结语

BentoPDF 不是那种只适合收藏的项目,而是很容易落到实际工作里的工具。功能够用,部署够轻,隐私这件事也考虑到了。

如果你手里经常过 PDF 文件,又不想总把资料交给外部平台,这个项目可以重点看看。

源码

文档

看完不过瘾,那就自己发一篇吧!
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
相关推荐
评论 抢沙发

请登录后发表评论

    暂无评论内容