Reading | IEEE VR 2019 Best Conference Paper

这次梳理IEEE VR 2019的最佳会议论文。

这篇论文的技术难度并没有特别大,不是一个庞大的系统,没有用到很复杂的数学模型,为了验证一个很简单的假设,做了十分全面而严谨的科学考证。

原文地址:Virtual Objects Look Farther on the Sides: The Anisotropy of Distance Perception in Virtual Reality

在展开详细的解析前,先从结论入手。这篇论文的结论和文章标题一样简洁,即虚拟环境中人眼对距离感知的各向异性。更进一步,在以自我为中心的视角下(egocentric),对于虚拟环境中同距离的两个物体,人类视觉系统会告诉大脑:正前方的物体比侧方的物体更近。

这篇论文首先回顾了真实和虚拟环境中人们对距离感知的相关工作,并提出关于距离感知各向异性的若干猜想,接下来设计并进行了4个实验来验证上述猜想。

相关工作

关于视觉系统的误差,作者从虚拟环境和现实环境两个方向的研究工作出发展开调研。

虚拟环境方面,前人验证性的工作和相关结论有:

  • 对置于地面的物体,接近视场中央的物体会显得更近。该结论可能受到VR头显的视场角(FoV)和重量影响;
  • 图形渲染质量可能影响距离感知;
  • 虚拟环境和真实环境的相似性(一致程度)会影响用户的经验判断。

真实环境方面,则偏向于生理角度出发,探索视觉系统的内部机理。相关工作可以上溯到18世纪。

  • 目前学界没有对视觉系统的机理达成共识,各种理论模型包括:欧式模型(Euclidean)及其变体,球面模型(spherical),李代数群(Lie algebra group)等;
  • 部分工作着力于寻找视觉系统成像的固有曲率(intrinsic curvature)。部分工作指出人类视觉系统的固有曲率(从近至远)呈现出椭圆->双曲线->抛物线的曲率变化趋势。

经过上述调研,可以看出真实环境方面的探索工作要更有深度,虚拟环境中的相关实验还不多。作者的工作从虚拟环境出发,提出以下假设:

  • 假设1:存在以自我为中心的正向和侧向距离感知差异;
  • 假设2:在正向和侧向存在感知差异的基础上,侧向角度越大,差异越大;
  • 假设3:视觉刺激在视场角中的位置会对距离感知产生影响;
  • 假设4:给予更多深度与纹理信息的情况下,视觉感知差异仍然存在。

可以看出,假设1和2之间是递进且不重复的,而假设3和4既是对1和2的一种补充,也是对前人工作的一次再验证。

实验解析

针对4个假设分别设计了4组实验,并分别邀请4组实验人员进行验证。

  • 人员分布
    • 实验一:共21人,年龄分布在20-43(均值24.3,标准差4.9)
    • 实验二:共16人,年龄分布在18-56(均值29.4,标准差10.4)
    • 实验三:共15人,年龄分布在20-51(均值31.3,标准差10.1)
    • 实验四:共16人,年龄分布在18-52(均值31.9,标准差10.6)
  • 具体流程

    • 填写基本信息表

    • 配合口头讲解和纸质材料,理解实验说明(此处不会告知参与者实验的最终目的

    • 误差校正:由于VR头显相对用户头部有一定前移(如下图所示),因此在进行实验前需进行校准工作,最终保证不同角度下同距离的物体在显示器中所占的像素数量相同。

    • 系统试用:进行10次简单的操作来熟悉系统

    • 实验:若干次操作,被记录为实验数据用于后续分析

  • 每次操作的设计细节

    • 问题形式:2选1的选择题,实验人员选出自己更远的物体
    • 呈现形式:两个陆续出现在不同位置的视觉刺激(红色小球)
    • 呈现过程:语音提示出现位置->特定位置出现第一个红色小球并持续2.5秒->消失0.5秒->另一特定位置出现第二个红色小球并持续2.5秒->消失后呈现问题->用户手柄选择
    • 其他细节-天空盒颜色:白色-用户观察目标的时间;黄色-用户回答问题的时间;绿色-不同实验间的休息时间。
  • 实验设计

    实验的具体设计是本文的重中之重。下面以验证第一个假设的实验为例展开描述。

    场景中存在两个用来给用户观察的小球,外观上呈现为红色。其中一个小球和用户头部的距离始终不变(3m),称为参考物(Reference);另一个小球会在实验中出现距离变化,称为对照物(Comparison)。为了考虑到各种方面的影响,作者考虑了4个因素的组合关系实验(记为C1-C4):

    • C1-参考物的出现位置:分为「中央」「侧面」2种
    • C2-侧面位置的选择:分为「左侧」「右侧」 2种
    • C3-对照物相对参考物的位置(到用户的距离差值):分为「-0.3m」「-0.15m」「0m」「0.15m」「0.3m」 5种
    • C4-两个球的出现顺序:分为「参考物先出现」和「对照物先出现」 2种

    这样,一组实验就包含了40种操作,重复3组后,每个实验人员需要进行120次操作。

  • 数据分析

    实验数据处理过程。采用Logistic Regression拟合曲线:

    \[f(x)=\frac{1}{1+e^{-\alpha(x-\beta)}}\]

    其中$x$为对照物的相对位置(C2设定的5个离散值),$f(x)$为实验数据中,实验人员选择参考物距离自己最近的比例。曲线拟合效果如下图所示:

后面几个实验的设计和数据分析就大同小异了。更换不同的实验人员,更换实验组合,重新拟合数据。

关于实验结论,基本与前文提出的假设是一致的。但数据和图表更能量化出这些假设的细节程度。

未来工作

这个实验的设计和结论都很漂亮,未来工作的坑也很多。比如作者举出的:

  • 扩展到更多VR头显设备和更多范围的视场角
  • 扩展到更多距离范围的验证(目前是3m左右的10%)

以及其他更多的脑洞和未挖的坑。


大致梳理了一遍论文主体结构,后面说一点想法。

在第一遍扫完文章结论的时候,大脑里有一些简单的实验设计思路。看到作者的工作后,深刻体会到严丝合缝的思路和对结论支撑的重要性。

一开始的假设是一个「是与否」的问题,验证后演化为「是多少」的问题,接下来解决如何量化和细化的问题。这才有了最终的实验曲线。

此外,这篇论文也从另一个角度体现了虚拟现实的价值。以前,虚拟现实设备的制造是为了迎合人体的特性来呈现虚拟刺激,而现在却可以反过来利用虚拟刺激进一步从生物学角度研究人体本身,尤其是视觉和听觉特性。

我们应该相信,虚拟和现实终究会演化成相辅相成的平行世界。