微软的 PowerToys 正在开发 OCR 功能

微软的 PowerToys 正在开发新的 OCR 文字识别功能，允许用户从图像中提取文本。

消息来源于 PowerToys 的 GitHub PR “[WIP] [New PowerToy] Create new OCR PowerToy #19172”

此 PR 引入了一个新的 PowerToy OCR 功能，通过选择矩形区域、单击单词或右键单击图像文件并选择 PowerOCR，可以在屏幕上的任何位置执行文字识别。

截至 7 月的第一周，要让这个 PowerToy 功能成熟还有很多工作要做，欢迎拉取和构建这个工具，大部分代码都是从我的存储库 Text Grab 复制的。

目前该 OCR 的基本功能已经搭建完毕，这是来自 PR 的演示：

可以注意到，基本的英文 OCR 功能已完成，但距离一个成熟的功能还有太多事情要做，比如现在选取完毕后默认识别，没有右键单击的选项，也无法调整选区。此外，识别稀疏的英文非常简单，任何一个 OCR 工具都能做到，能否识别其他复杂场景，比如排版紧凑的中文，带有艺术字体的文本...这些才是 OCR 工具的开发难点。

目前来看，这项工具还需要大量开发工作，现在的情况是：