该扩展程序在浏览器中添加了一个工具栏按钮,单击该按钮后,用户就可以在当前活动的窗口中选择一个区域。该扩展程序捕获该区域,并尝试使用内部功能强大的OCR引擎识别该区域内的文本。该扩展使用 tesseract.js”库,该库支持100多种语言,自动文本定向和脚本检测。
此扩展将在页面上加载JS库,并在完成OCR后将其删除。这样就不会长期使用资源。
注意:在第一次运行时,扩展程序可能需要几分钟才能从Internet上获取训练数据。由于此资源已缓存,因此所有后续调用都将很快。
注意:光学字符识别(OCR)本质上是缓慢的,因此此扩展程序为每个检测模块显示进度条。
注意:此扩展程序使OCR脱机处理。没有服务器端交互。它只获取一次语言培训数据库。
注意:当禁止用户节时,此工具可用于从图像中提取文本内容或提取网页的内容。