您的位置:首页 >综合百科 >正文

谷歌幻灯片扩展可以让盲人用户更容易使用演示软件

摘要 屏幕阅读器可将数字文本转换为音频,使许多残疾用户(包括盲人、弱视或诵读困难者)更容易使用计算机。然而,Microsoft PowerPoint 和 Goo...

屏幕阅读器可将数字文本转换为音频,使许多残疾用户(包括盲人、弱视或诵读困难者)更容易使用计算机。然而,Microsoft PowerPoint 和 Google Slides 等幻灯片软件的设计目的并不是使屏幕阅读器的输出保持一致。当屏幕阅读器浏览内容时,此类程序通常依赖于Z 顺序(Z 顺序遵循对象在幻灯片上分层的方式)。由于 Z 顺序不能充分表达幻灯片在二维空间中的布局方式,因此残疾人可能无法使用幻灯片软件。

由华盛顿大学研究人员领导的团队为 Google Slides 创建了 A11yBoard,这是一个浏览器扩展和手机应用程序,允许盲人用户浏览复杂的幻灯片布局和文本。A11yBoard 将台式计算机与移动设备相结合,让用户可以使用音频、触摸、手势、语音识别和搜索来了解不同对象在幻灯片上的位置,并移动这些对象以创建丰富的布局。例如,用户可以触摸屏幕上的文本框,屏幕阅读器将描述其颜色和位置。然后,使用语音命令,用户可以缩小该文本框并将其与幻灯片标题左对齐。

该团队于 10 月 25 日在纽约ASSETS 2023上展示了其研究成果。A11yBoard 尚未向公众开放。

“长期以来,甚至现在,无障碍功能常常被认为是,&luo;如果我们能够让盲人使用现代产品,我们就做得很好了。&ruo;” 绝对,这是一个优先事项,”资深作者、华盛顿大学信息学院教授雅各布·O·沃布洛克 (Jacob O. Wobbrock)说。“但这只是我们目标的一半,因为这只是让盲人使用别人创造的东西。我们希望让人们能够创建自己的内容,而不仅仅是只有标题和文本框的 PowerPoint 幻灯片。”

A11yBoard for Google Slides 建立在 Wobbrock 实验室的一系列研究基础上,该研究探索盲人用户如何与“画板”交互,“画板”是用户在其上处理文本框、形状、图像和图表等对象的数字画布。幻灯片软件依赖于一系列这样的画板。当主要作者、华盛顿大学 iSchool 博士生Zhuohao (Jerry) Zhan g加入 Wobbrock 的实验室时,两人寻求解决幻灯片软件等创意工具的可访问性缺陷的方法。借鉴Wobbrock 实验室对盲人使用画板问题的早期研究,Wobbrock 和Zhang 在 4 月份推出了A11yBoard 原型。然后,他们致力于创建一个可通过现有软件部署的解决方案,并选择了 Google Slides 扩展。

在这篇论文中,研究人员与共同作者、斯坦福大学盲人Gene SH Kim合作改进了界面。该团队与另外两名盲人用户进行了测试,让他们重新创建幻灯片。测试人员都指出,A11yBoard 极大地提高了他们理解视觉内容和自行创建幻灯片的能力,而无需与协作者不断地来回迭代;他们只需要在整个过程结束时才需要一名有视力的助手参与。

测试人员还强调了需要改进的地方:在尝试编辑对象时持续了解对象的位置仍然是一个挑战,用户被迫单独执行每个操作,例如从左到右对齐多个视觉组,而不是完成这些重复的操作批量操作。由于Google幻灯片的功能,该应用程序的当前版本也不允许用户在不同设备上撤消或重做编辑。

最终,研究人员计划向公众发布该应用程序。但首先他们计划将大型语言模型(例如 GPT)集成到程序中。

“这可能会帮助盲人更有效地使用自然语言命令编写幻灯片,例如&luo;使用左边缘对齐这五个框&ruo;,”张说。“即使作为一名可访问性研究人员,我也总是对这些常见工具的难以访问性感到惊讶。因此,我们通过 A11yBoard 着手改变这一现状。”

这项研究的部分资金由华盛顿大学无障碍技术和体验研究与教育中心 (UW CREATE) 资助。

版权声明:本文由用户上传,如有侵权请联系删除!