文献翻译小结

简要回顾毕业设计文献翻译工作。

主要流程：查找 -> 选定 -> 阅读 -> 翻译 -> 排版 -> 校对。

从确定开始做到彻底完工，差不多刚好一周时间，当然中间断断续续为实验室的网站做图大约耗费三天，周末浪掉一天，纯用于翻译的时间大概3个整天。

查找

查外文文献主要去的几个地方（首先抛弃知网）：

Semantic Scholar

IEEE Xplore Digital Library

FindaRticles

比较喜欢使用第一个网站来找计算机科学相关的论文。

该网站是由微软联合创始人 Paul Allen 做的免费学术搜索引擎，其检索结果来自于期刊、学术会议资料或者是学术机构的文献。这个搜索引擎能检索到 80% 的免费论文文献，大约有 300 万份，另外它直接提供图表预览，看起来能方便研究人员省下更多筛选的工作。这个搜索引擎覆盖的学科从计算机科学扩展到了脑科学，除了利用作者、出版商标注的关键词这种常用的方式外，还精确到了信息筛选上，例如用计算机视觉等技术搜寻论文发布的会议名称、论文发布的时间，从论文文中筛选出关键词句等，这会让搜索结果的信息看起来更加丰富。

摘自：https://zhuanlan.zhihu.com/p/25165455 （这个链接里还推荐了不少其他文献检索网站）

选定

毕设选题是“基于图像的室内场景建模”，算是一个比较老的方向，已有不少现有的系统能做出很好的效果。目前市场上有不少消费级深度相机，即不仅记录像素，还会记录对应深度信息。而仅仅基于图像建模，图像本身是不含深度信息的（根据视差做深度估计）。

因此，我将文献关键词确定为「多视图(Multi-view)」、「室内场景(Indoor Scene)」、「建模(Modeling / Reconstruction)」，且文献要比较新（以最近三年的文献为标准）。找到的相关文献很多，但完全符合要求的几乎没有，特别是在「多视图」和「室内」这两个关键词之间难以平衡。因为同时包含这两方面的文献往往比较旧，仅包含一个方面又无法最大化文献价值。最后，我不得不在这两者之间做个妥协，选下了室内场景建模相关的文献（用的是深度相机）。

我选择的文献是：Yizhong Zhang, Weiwei Xu, Yiying Tong, and Kun Zhou. 2015. Online structure analysis for real-time indoor scene reconstruction. ACM Trans.Graph. 34, 5, Article 159 (October 2015), 13 pages.DOI: http://dx.doi.org/10.1145/2768821

Tips.

所选文献的参考文献列表最好是顺序排列的（按照编号[1][2][3]这样）。

我这次选定的文献所引用的参考文献排序非常混乱，为了整理到学校给的翻译模板中耗费了不少时间（需要把参考文献按照在文章中出现的顺序重排列并修改格式）。所以，一定不要选这种乱序参考的paper（这种引文方式太不友好了）。

最好选与字数要求近似的文献。

比如校方要求翻译文献字数要超过5000字，那差不多原文5页纸就够了。（我选择的文献共13页，最后翻译总字数18000+）

一定要确保文献的PDF足够清晰。

便于后面选取整段用Google翻译，打印下来的阅读体验也会好很多，不会看到一堆马赛克。

阅读和翻译

这个过程没什么说的，打印一份纸质版，慢慢啃过开头几章概述性文字，把一堆相对陌生的概念理顺（至少知道它们分别代表什么），把生僻的单词查出来写在边上。这样看到后半段的时候速度就会有明显提升。

读到一多半，觉得比较乏味的时候，就可以开始码字翻译了。意思一看就懂的段落可以交给Google翻译处理（这样不会翻错），个别长难句还有一些词的意思要仔细斟酌。比如：

map：图？映射？
object：对象？物体？
label：标签(n) ？标记(v)？
volume：体量？体积？体？音量？
plane：经常被机器翻译成飞机..

举两个句子翻译的例子。

不适合直译的句子

An exterior point is selected from depth pixels predicted to be on the planar region by plane extension, but observed to be off the plane due to depth inconsistency.

Google是这么翻的：

从预测在平面区域上通过平面延伸预测的深度像素中选择外部点，但由于深度不一致而观察到离开平面。

这种翻译给人的感觉就是：为啥每个字我都看得懂但这连起来到底是啥啊？

其实英文部分也挺好懂的，但直译就贼难受。

我最后是这么翻的：

通过平面扩展，更多深度像素会被预测为平面区域，从这些像素中选出与平面深度不匹配的点作为外部点。

英文中最开头的词在中文里就变成了最后一个词（似乎一点都不奇怪）

长句

If an object matches an existing object with an extracted surface mesh with a low (partial)matching error, the mesh of the existing object is displaced as a virtual object in our graphical interface, allowing the user to decide whether to keep scanning based on how well the perceived match of the complete shape.

Google：

如果一个对象与一个具有低（部分）匹配错误的提取表面网格的现有对象相匹配，则现有对象的网格在我们的图形界面中作为虚拟对象被移位，从而允许用户根据如何保持扫描以及完整形状的感知匹配。

一个字：乱。

我的版本：

用户在扫描过程中，系统将提取物体的表面网格。如果此网格和一个现有物体的网格相匹配（具有低错误率），则将现有物体网格作为虚拟物体放置在我们的图形界面中，让用户根据感觉判断物体的形状匹配程度，从而决定是否继续扫描。

简单的讲，就是把上下文涵盖在翻译里，让逻辑更通顺，一句不容易表达可拆成多句，以让读者理解为首要目的（第一读者当然是自己）。

另外，翻译的时候连带插图中的内容也要一起翻译，个人用Photoshop解决（矩形选区选择英文字段->填充成白色->在远处用类似的字体和字号输入中文）。

排版和校对

按照要求设置字体、字号、段落行距，在适当的位置插入图片，尽量不留大面积空白，不产生阅读障碍。

雠校，一人读书，校其上下，得谬误为校。一人持本，一人读书，若冤家相对。

——刘向《别录》

个人校对的过程是再读一遍文本，找找不通顺的地方或者错误。在此基础上，将特定的用词统一化，比如「robust」这个词，可以翻译成“健壮性”，也可以翻译成“鲁棒性“，「object」这个词，在抽象的段落里可译作「对象」，在和「平面」这种具象概念并列时应译作「物体」。做到前后统一，更有利于读者理解。

举个例子，去年读过一本翻译质量的很差的书，叫《深入理解游戏产业》（直接点名说了，反正这书出版都过去十年了），为什么说它翻译差呢？因为它会在一章内把一个概念用三种名字翻译过来。比如「scale」这个词（用来描述游戏世界的“范围”），在一章的开头，译作“范围”，中间讲解的时候，又直接译成“界限”，再到习题的选项里，翻译成了“大小”。本来还打算无聊的时候读一读，看完一章之后再无任何兴趣，直接转投英文原版了。

翻译完成后其实想把译文发给文献作者看一眼，提些小问题。

然而没找到第一作者的邮箱，作罢。

以前读文献，基本都是看过做点笔记整理就过去了，真正逐字逐句来翻译的时候，还是会遇到若干新问题。

以后自己写论文的时候，又会是什么体会呢？