只需单击鼠标右键,即可使用AI的功能为图像添加字幕。
让我们使网络更易于访问。
这是什么?
自动替代文字是Chrome扩展程序,可以为图片生成描述性标题。
当前,视障用户必须依靠网站开发人员输入的元数据和替代文字描述,才能了解图像实际包含的内容。但是,并非所有Web开发人员都花时间为所有图像添加字幕。这是自动替代文字介入的地方。
使用人工智能,扩展程序可以分析图像并在5秒钟内检测出所描绘场景的内容!
它是如何工作的?
设置和运行非常简单!:
下载扩展
右键单击任何图像元素(此刻注释不适用于背景图像)
点击下拉菜单中的获取图像信息”
等待几秒钟,获取标题
它背后的技术是什么?
自动替代文字基于imy2txt模型,该模型是Vinyals等人为2015年MCOCO图片字幕挑战赛创建的。
该模型本身基于编码器-解码器神经网络(基本上是与LSTM配对的深层转换网络)。深度转换网络首先使用Inception v3(流行的图像识别模型)将图像编码为矢量表示。然后,LSTM根据Inception v3编码创建字幕模型。
我将模型转换成API并进行了缩减,以使其可以适合Lambda实例并保持加载到内存中,以在5秒内获得快速响应(相比之下,模型进行开箱即用需要15秒以上的时间) 。