Oss Document Scanner文档扫描仪是一款开源应用程序,用于扫描您的所有文档。您可以使用相机或导入图像进行扫描。在扫描时能够自动检测照片中的文档并裁剪图像。创建文档后,您可以使用 OCR 检测文档中的文本。您还可以以 PDF 形式共享您的文档。如果您愿意,您可以将应用程序数据与 webdav 服务器(例如 nextloud)同步,以免丢失任何内容!
开源且集成 OCR:
基于 Tesseract OCR 引擎(需手动下载语言包),支持中、英、日等多语言文本识别。
扫描结果可直接导出为带 OCR 文本层的 PDF,实现 “所见即所搜”。
智能图像处理:
自动矫正文档角度、去除阴影,支持边缘检测和透视变换。
提供 “增强模式” 优化低光照或模糊图像,提升 OCR 准确率。
轻量化与兼容性:
体积仅 5MB,适配 Android 5.0 及以上系统,可从 F-Droid 直接安装。
支持导出为 DOCX(需安装 Microsoft Office 插件)和纯文本格式。
使用场景
学术研究:扫描论文并提取文本,方便引用和编辑。
数据录入:批量扫描表格或手写笔记,通过 OCR 生成结构化数据。
跨境业务:扫描多语言合同,结合翻译工具(如 Crow Translate)实现实时翻译。
一、基础操作:快速上手扫描功能
1. 启动与界面导航
首次启动:打开应用后,主界面显示 扫描(Camera) 和 导入(Import) 按钮。
界面布局:
顶部工具栏:包含 滤镜(Filter)(黑白 / 灰度 / 增强)、批量扫描模式(可连续拍摄多张文档)、设置(Settings)。
底部操作栏:快门按钮(扫描当前画面)、相册导入(从本地选择图片处理)、已保存文档列表。
权限授予:首次使用需允许 相机 和 存储 权限,否则无法扫描或保存文件。
2. 扫描文档的标准流程
步骤 1:取景与对焦
保持文档平整,光线充足,将手机摄像头对准文档。应用会自动检测文档边缘并显示 蓝色边框。若边缘检测不准确,可手动拖动边框四角调整。
步骤 2:拍摄与优化
点击快门后,应用自动校正透视畸变,并提供 增强模式(去除阴影、优化对比度)。建议开启 自动增强(在设置中启用)以提升扫描效果。
步骤 3:编辑与裁剪
扫描结果进入编辑界面后,可:
手动裁剪:拖动边框调整扫描范围,支持放大镜辅助精确选择。
添加滤镜:选择 黑白模式 提升文字清晰度,或 灰度模式 保留原始色彩。
旋转 / 翻转:点击旋转按钮调整文档方向。
3. 批量扫描与自动保存
批量模式:
点击顶部 批量扫描 按钮,可连续拍摄多页文档。应用会自动生成多页 PDF,适合扫描书籍或合同。
自动保存设置:
在 设置 → 保存路径 中选择默认存储位置(如内部存储 / SD 卡),并开启 扫描后自动保存,避免因误操作丢失数据。
二、核心功能:OCR 文字识别与导出
1. 启用 OCR 识别
触发方式:
扫描完成后,点击编辑界面底部 OCR 按钮(或在已保存文档列表中长按文件选择 “识别文本”)。
语言包下载:
首次使用 OCR 时,应用会提示下载 Tesseract 语言包(如 “chi_sim” 中文简体)。可在 设置 → OCR 语言 中手动添加其他语言(如英语、日语)。
识别参数调整:
增强模式:开启后优化低光照或模糊图像的识别效果。
识别区域:框选文档局部进行精确识别,适合提取表格或特定段落。
2. 导出与格式选择
导出选项:
识别完成后,点击 导出 按钮,支持:
PDF(带 OCR 文本层,可搜索):适合存档或分享。
DOCX(需安装 Microsoft Office 插件):导出为可编辑文档。
TXT:纯文本格式,适合快速复制内容。
高级设置:
在导出前可调整:
分辨率(建议 300 DPI 用于印刷)。
压缩率(平衡文件大小与清晰度)。
书签生成:自动为多页 PDF 添加章节书签。
3. 验证与编辑识别结果
文本校对:
导出前点击 预览,查看 OCR 识别结果。长按文本可手动修改错误(如 “未” 识别为 “末”)。
多语言混合识别:
扫描包含中英文的文档时,需在 设置 → OCR 语言 中同时勾选 “中文” 和 “英文”,确保混合文本准确识别。
三、高级技巧:优化扫描与识别效果
1. 图像预处理策略
光线与角度:
避免文档反光,可使用台灯从侧面补光。
保持手机与文档垂直,减少透视畸变。
背景处理:
扫描时选择纯色背景(如白色墙面),避免复杂图案干扰边缘检测。
启用 背景去除 功能(在滤镜中),自动虚化背景。
2. OCR 准确率提升方法
图像增强:
使用 黑白滤镜 突出文字与背景的对比。
手动调整 对比度 和 亮度(在编辑界面滑动底部调节条)。
字体与排版适配:
对于手写笔记,启用 手写识别模式(在 OCR 设置中)。
扫描表格时,确保表格线清晰,必要时使用 增强模式 强化线条。
3. 与其他工具联动
文本编辑:
导出 DOCX 后,可通过 Umi-OCR(开源 OCR 工具)进一步校正识别错误,或使用 Crow Translate 进行实时翻译。
云存储同步:
在 设置 → 自动同步 中关联 坚果云 或 Nextcloud,扫描结果自动上传至云端,实现多设备共享。
Q1:OCR 识别结果不准确
A:
检查语言包是否下载完整(进入 设置 → OCR 语言 确认)。
重新扫描文档,确保文字清晰、无倾斜。
尝试切换 增强模式 或 黑白滤镜。
Q2:导出的 PDF 无法打开
A:
确认导出路径正确(在 设置 → 保存路径 中查看)。
使用第三方 PDF 阅读器(如 Adobe Acrobat)打开,避免系统自带阅读器兼容性问题。
Q3:批量扫描时自动合并失败
A:
确保批量扫描模式已开启(顶部工具栏按钮高亮)。
扫描过程中不要频繁切换页面,保持文档内容连贯。