2018伯克利冬令营(2) 带着问题搞科研

夜间的北风吹散了天空的云,一扫昨日灰暗的天色。金色的阳光富有穿透力,伯克利校园里明亮的建筑外墙在蓝天下愈发鲜艳。加州的早晨像深秋,中午像盛夏。

今天参与的内容是一堂课和一个开放式研讨会,课程主要内容偏能源和化学,研讨会是经济学相关。由于涉及范围比较广,并且和自身专业没太大关联,因此主要思考集中在他们的研究思路:发现问题 -> 寻找原因 -> 提出方案 -> 建立模型 -> 验证方案 -> 优化方案 -> 更进一步 -> 发现问题 ->…如此递进,直达本质。


照例从宾馆吃完早饭,上午在一个酷似酒吧的大堂内开始了本次行程的第三堂课,由Farhad Fathieh主讲,课程主题很有意思,叫做「From Engineering to Science」,讲述了Fathieh自己从本科到博士后的科研经历:由高新科技相关的工科作为起点,最后投向理科研究的过程,颇有一种返璞归真之意。

Fathieh首先从航空领域的研究讲起,包活发动机的内部结构、能量转换和传递等。由于大学三年没学物理,Fathieh语速很快,这部分也听的相对吃力。不过他描述科研成果时一句慷慨激昂的「Excited!」,让我也瞬间觉得亦可赛艇。

硕士结束后,Fathieh前往加拿大攻读博士。加拿大是个很冷的地方,他注意到不仅是加拿大,世界上的许多地方每年在调节室内温度上面的开销惊人(他给出的统计数据为$200 Billion)。另一方面,室内的湿度也会影响细菌、病毒、化学反应等,适宜的湿度同样是人类生活必不可少的。

结合这两点,他继承导师博士期间的工作,攻读机械工程领域的博士,研究空气交换机,以能量轮(Energy Wheel)的结构实现。

能量轮内部首先需要多孔(Porous)材料,用以增大和气体分子的接触面积,一次性吸入更多气体。Fathieh进一步从物理、化学、吸附性、传输能力四个方面阐述了材料的选择标准,并介绍「小规模测试」这一常用手段进行材料和结构研究。听罢很受启发。

小规模测试(Small Scale Testing):Fathieh以飞机机翼的构造为切入点,讲述人们建造飞机机翼时会优先构造一个等比缩放若干倍的小模型,并执行相关性能的测试。我们可以直观地看出,只要等比缩放的方法足够合理和可靠,这样的方法既省时又省钱。

接下来Fathieh用部分篇幅介绍他建立的数学模型,用以拟合随时间变化的热转化数据,此模型是双指数模型(Double Exponential Model (DEM)),全程没看懂。

这里有个插曲:同行的室友是数学系大二的,晚上11点困得想睡觉了,但发现群里共享了课件。于是开始仔细看数学模型,越看越兴奋,导致看到0点多睡不着了(真是搞科研的料),并发现看似很平常的一页ppt中展示了对数据的完美拟合,然而上课的时候教室里似乎没有人注意到这个让人震惊的地方。

Fathieh本人从本科到博士均为工程背景,为什么最后会转投理科的研究?这也是他上课向我们提出的问题。

从航天工程到机械工程,这一步比较容易理解,而他在机械工程研究的后期,逐渐发现优秀的材料对于热量转化的重要性,并不断尝试新材料,效果却不理想。这时他顿悟:是时候开始搞化学了。当然,科学研究的最终目的是为人类服务,这就是他博士后期间的工作。

Fathieh接下来向我们介绍水资源的稀缺性,世界上有1/3的人无法直接获得洁净的水。但是,大气中却有3 000 000 000 000 000 000 000(3的21次方)升水。倘若能将这些水资源加以提取利用,是否可以缓解很多缺水地区的困难呢?因此他开始了寻找化合物->创造化合物->验证化合物的过程。

根据调研,为了达到这一目的,所使用的化合物必须具备三个标准:吸收和释放的过程必须在某一条件附近具备突变/吸收和释放水分子都不需太多能源/在多次吸水和释放后保持性能稳定。在反复试验和研究对比后,该工作进行的比较顺利,他们创造的化合物达到了预期效果。对研究的具体细节不作过多描述。

课程结束前,他向我们简单讲了讲10年科研生涯的心路历程。「Comfort Zone」这一概念让人印象深刻。

Comfort Zone: 舒适空间,就是在一个领域时间长了以后,会本能地不愿意转换领域,而选择在一条路上继续往下走,即便问题迟迟未能解决。他在博士阶段结束后意识到,自己必须要换个领域才能真正解决问题,因此恶补理论知识,最后到了伯克利Yaghi研究组继续深造。

出于对科研工作者的敬畏(和进一步勾搭的想法),我挑出一张从学校带来的明信片,简单写了几句祝福的话和落款,送给了这位学者(非常感谢教务老师抓拍了合影


如果说上午的课程算是听个思路,下午的研讨会就完全是在感受氛围了。

这场研讨会的主题是「Diagnostic Expectations and Stock Returns」(诊断期望和股票收益,不知道是不是这么翻译,欢迎经济学读者拍砖)。演讲者据说是位意大利人,英文带着浓重的欧洲口音(比如会把「r」音发成「l」,自带舌头的抖动声)。刚开始没几个词听得懂,后来借助PPT和他讲解的对应关系,居然慢慢听习惯了,发现还不怎么难懂。

首先,他阐述了一个经济学中的问题(Puzzle in finance),即股票价格过度波动和收益难以预期。因此,他们的研究团队以本金、收益和预期作为三个变量,寻找它们之间的联合分布(Joint distribution)情况。

开始讲自己的工作之前必定要介绍相关研究工作,主讲人介绍了「bayes belief-based model」和一些经典的数据集(CRSP、COMPUSTAT、IBES等),以及一些专有名词缩写的定义。

LTG(Long Term Growth):长期增长,分为LLTG(Low LTG)和HLTG(High LTG),即增长的期望下限和上限。

EPS(Earnings per share):每只股票的收益。

Boom-bust:盛极而衰的现象

为了研究股票,首先要研究这一公司的质量,最直接的行情就是对新闻的观察,主讲人提出一般分析师存在三个问题:

  1. 对新闻的反馈就像他们正在学习公司的质量一样(Analysts react to news as if they are learning the firm’s quality)——说明分析师对新闻的反馈比较片面
  2. 对新闻的反馈在预测走势时会出错(There appear to be extrapolative errors in the reaction to news)——个人确立的模型不稳定
  3. 错误会反映在收益中——这会影响投资者的决策

为此主讲人提出了自己的一套模型:

  1. 分析师需要推断一个公司的质量;
  2. 具有代表性的实例很重要,我们允许通过对这种实例的分析来扭转初步预测;
  3. 对比合理的数据和扭转后的数据。

具有代表性的实例(Representativeness)的具体定义如下:

计算方式和概率估计:

\[R(\tau , G) = \frac{Pr(T = \tau | G)}{Pr(T = \tau | -G)}\] \[Pr^{\theta}(T = \tau|G)=Pr(T = \tau|G)·[\frac{Pr(T = \tau|G)}{Pr(T = \tau|-G)}]^\theta \frac{1}{Z}\]

参数的具体定义没记清..大致能理解模型的意思,概率估计式子中,$\theta = 0$时为无偏预测。

然后举出医学诊断的例子来说明G的定义和预测的概念:

G:诊断为阳性时,90%概率为健康(假阳性)

-G:总患病率为1%

接下来是噪声建模,听了大概,没完全搞懂,不曲解了。

最后是模型的测试和调整,这个过程台下质疑声很多,大佬们的对话语速很快,一大串专有名词实在来不及反应,放弃记录。

总的来说,这次经历深刻感受到了伯克利在学术方面开放的氛围:任何人都可以进入进行研讨会的教室,即便你听不懂甚至互不认同。下午的教室不大,我们一行人到的比较早,坐在了教室的前几排,一个组织者带着好奇打量了我们一番:“What are you doing here?” “We are going to listen to the seminar.”(干啥来的?听研讨会的。)然后他就笑笑,”OK, perfect!”,就没过多质疑了。

另一方面,回到整个日志的题目上,下午的研讨会更加深了我对研究过程的理解,即:发现问题 -> 寻找原因 -> 提出方案 -> 建立模型 -> 验证方案 -> 优化方案 -> 更进一步 -> 发现问题 ->…

挺有意思的,不是吗?


经过了课程和研讨会,一天也过去了大半,我和另一个同学一起到伯克利最老的图书馆自习(就是昨天下午写日志的地方)。这是一个开放式的图书馆,已有100多年历史,上楼梯的台阶中间都被行人才出了凹坑,却从来没有更换过地砖。桌子足够大,自习了一个多小时直到集合,舒服。

晚上吃美国特有的大披萨(对比可乐罐头就知道有多大了),四个人合吃一份都没吃完。

来到这边学习,自己就像疯狂希望吸收水分的树根,恨不得理清楚每一个细节,认识更多人,记录更多风景,写下更多故事。

晚安。