Allen Hu,third-year Ph.D. student in financial economics atYale School of Management.
Song Ma,Assistant Professor of Finance in Yale School of Management.
Research Interests: Primary: Corporate Finance, Entrepreneurial Finance, Innovation, Big Data; Secondary: Behavioral Finance, Education, Law and Economics, Antitrust.

前言
心理学中有一个著名的概念——“晕轮效应”(Halo effect),指代人际知觉中所形成的以点概面或以偏概全的主观印象。这种主观印象常产生于个人对某事物了解尚不深入的阶段,此时我们抓住的事物,其个别特征并不反映事物的本质,可我们却仍习惯以个别推及一般、由部分推及整体。举一个简单的例子:和陌生人初次接触时,我们总是不由自主地从以下几个方面进行观察:此人的外貌是否具有吸引力?着装是否合适?言谈举止是否机智风趣?肢体语言是否得体大方?值得注意的是,观察到长相端庄、言行优雅等特质后,我们往往自然地得到“她一定很优秀”、“他是个值得信任的人”、“我希望和她深入交流”之类的正向结论,这些结论在不经意间已被作用于我们的婚恋交友、投资合伙等重要决策。


在本次推送的文章中,Allen Hu 和Song Ma 两位学者便以风投事件(Venture Capital)为研究对象,探究与企业创始人的互动(Human Interaction)如何影响投资经理的决策。文章以初创企业申请投资时拍摄的路演视频作为数据输入,从视觉、听觉和文本三个维度上借助机器学习算法解析视频信息,量化人际互动的作用。结果显示,投资经理因受人际互动偏误(Interaction-induced Bias)的影响无法做出最优投资决策。他们倾向于投资在视频中表现出包括自信、热情等更多积极特质的初创企业,而这类企业事后被证实表现不佳。此外,文章进一步探究得到,18%的人际互动偏误来自于个人偏好(Taste-based Channel),另82%的偏误来源于失实的判断(Inaccurate-belief Channel)。
由于人际互动和经济学之间的联系往往可以从分析新数据中受益,文章的一大亮点在于其为经济学研究中对视频数据的应用提供了范例。此前路演视频,视频数据的复杂性和繁重的计算负担导致其在经济学研究中未被充分利用,因此文章的研究方法具有开拓性与普适性。例如,我们可以学习文章的研究方法,运用到诸如法庭、课程、面试录像甚至是其他非结构化数据的分析中,以此检验现有模型、获得新的见解。
研究背景
初创企业在加速器项目(accelerator programs)的申请过程中会被要求录制一个标准化的路演视频。这些视频通常在一分钟左右,用以介绍创始人团队并描述其商业理念。在商业计划可行性和创始人背景之外,投资经理的投资决策很可能也与创始人在路演视频的表现有关。例如,他们可能会关心,视频中的团队看起来是否积极向上?团队宣讲时是否足够热情和自信?团队看起来是否友好和易于相处?
(初创企业申请加速器项目时的填报页面展示)
一种观点认为路演视频,投资经理可以从路演视频中得到创始人的人际交往能力等额外信息,创始人自信的言谈举止也许预示着产品本身的高质量或良好发展趋势,因此有助于投资决策。与之相反的是,另一种观点认为这样的人际互动将导致投资经理因为个人偏好(例如,我更喜欢和热情的团队合作)或者失实的判断(例如,这个团队很热情,因此他们的想法一定是很好的)而产生决策偏误。由此,文章提出了两个研究问题:
1. 人际互动中体现的一些特质会影响经济决策吗?
2. (如果第一个问题的答案是肯定的)人际互动具体如何影响经济决策?
数据来源
文章使用的数据来源于2010-2019年间初创企业申请加速器项目时录制的路演视频、初创企业的公司级信息和创始人团队背景信息三部分。
A.路演视频
文章使用了取自美国五大加速器项目:Y Combinator, MassChallenge, 500 Startups, Techstars, AngelPad 的共1139条路演视频作为样本。由于申请人被要求通过Youtube等链接转交路演视频,因此在提交申请的同时,视频也被上传到了这些公开网页。作者为两个公共视频分享网站YouTube和Vimeo开发了一个自动搜索脚本,只需使用预定义的搜索关键字便可以返回需要的视频列表。

(在Youtube上搜索相关路演视频的界面展示)
B.初创企业的企业级信息
基于已获得的路演视频,手动依照申请者的姓名、申请ID、商业介绍等信息在Crunchbase和 PitchBook两大数据库中进行匹配,从而获得企业层面包括成立年份、地点、经营状况、总融资轮数和金额、投资者数量和员工人数等数据。
C.创始人背景信息
在LinkedIn中提取各路演视频中企业创始人最近五段教育经历与最近十段的工作经历,用于构建衡量每个团队成员学历、工作资历、创业经验等变量。
研究方法

(研究方法流程图)
作者首先将路演视频从视觉(Visional)、听觉(Vocal)、文本(Verbal)三个维度进行解析。
A. 视觉(Visional)
在视觉层面,作者以每秒十帧的速度采样图像,使用旷视公司(Face++)的人脸识别技术监测分析每一帧图像内诸如微笑、眨眼、挑眉等面部表情,存储为数据格式,并利用情绪识别算法将得到的面部表情数据归类为快乐、悲伤、愤怒、恐惧、恶心、中立的六个维度。在文章中,作者以积极表情、消极表情做了进一步归类。此外,作者就图像中出现的人物做了颜值衡量,并获得了诸如性别、观测年龄等人口统计学变量。


(表情积极性较高和较低的图像对比)
B. 听觉(Vocal)
给定采样率和分辨率,语音(本质上是声波)可以被数字化为振幅的连续时间序列。在听觉层面,作者首先基于服务语音特征提取、分类、分割及应用的Python包pyAudioAnalysis (Giannakopoulos, 2015) 提取出34个低维语音特征,进一步使用机器学习算法构建更高维度的变量并实行语音情感分析。这里作者提供了两个进行语音情绪分析的框架:
(1)使用pyAudioAnalysis 从兴奋性(arousal) 和valance两个维度对语音进行建模;
(2)使用speechemotionrecognition 从快乐、悲伤、中立三个维度对语音进行建模。


(兴奋性(arousal)较高与较低的语音对比)
C. 文本(Verbal)
在文本层面,作者将视频演讲内容转换成词频矩阵,以追踪演讲中各类单词的使用情况。具体而言,作者首先使用Google Cloud提供的语音文字转换API从语音中提取得到包括单词列表、时标、停顿的文本信息。此后,将文本信息对应到两个常用的字典*中,借以分别分析文本的积极(消极)性与文本所体现的个人能力、友好程度等信息。

(友好程度较高的文本展示)
*The first dictionary is the Loughran-McDonald Master Dictionary. The second dictionary is developed by social psychologists using Wordnet and word embeddings.
明确了各渠道信息的获取方式后,作者依据视频中出现各类情绪的时长分别构建“视觉积极性/消极性”,“听觉积极性/消极性”,“听觉兴奋度”等变量,依据演讲文本词频构建“文本积极性/消极性”,“文本友好程度”等特征变量。由下表可见,这些细分特征变量之间有较强的相关性。

(分类特征向量相关性表格)
此外,作者基于以上细分特征变量,通过主成分分析法构建了一个新的特征向量——Pitch factor。Pitch factor作为一个由视觉、听觉、文本特征所共同构成的综合指数,象征了路演视频所传达出积极、热情、友好等情绪的整体水平。
实证分析
A.回归模型与结果

本文使用logit模型进行回归分析,控制变量中所有视频特征均已标准化。考虑到某些加速器可能吸引特定类型的初创企业,模型中控制了加速器固定效应。由于投资金额通常为基于标准合同的一个值(介于20,000美元至150,000美元之间),且在当年的每个加速器内是固定的,因此文章只关注投资与否的决策,即I(Invested) 虚拟变量,而忽略例如投资金额与具体合同条款等其他投资参数。

(回归结果展示,其中右半部分的表格在本节C小段中讨论)
结果显示,由路演视频得到的Pitch factor指数每增加一单位,该公司获得投资的概率增加3%。相较于平均约8.52%的基准融资率,这已是35.2%的上升。这一结果在视频的分类特征变量上也得到了体现:
a. 视觉层面:视频在视觉层面所体现的积极情绪每增加一单位,该公司获得投资的概率上升1.5%(相较于基准融资率上升17.6%)。相反的,视觉层面的消极情绪每增加一单位,公司收到投资的概率下降2.7%(相较于基准融资率下降31.6%)。这也体现了投资者相对于积极情绪,对视频中消极情绪的体现更加敏感。此外,作者发现,颜值越高的企业家越有可能获得投资。颜值的经济价值与“视觉积极性”大致相同,但小于“视觉消极性”效应。
b. 听觉层面:作者在听觉层面做了“积极程度”与“兴奋程度”两个维度的区分。结果显示,视频在听觉层面所体现的积极性/消极性的效应与视觉层面的含义相类似。此外,在听觉上显示出更多兴奋、激昂情绪的视频往往更能吸引投资。具体而言,语音兴奋情绪上一单位的增加可以带来获得投资概率2.3%的增加(相较于基准融资率上升27.1%)。
c. 文本层面:作者在文本层面做了“积极程度”,“友好程度”“对能力的展现程度”三个维度的区分。与前文结果类似,文本积极性的增加也会导致获得投资概率的增加。此外,体现友好性的单词词频与获得投资概率成正相关,而虽然投资经理理论上应更关注能力较强的企业创始团队,文章却发现展现团队能力的单词词频却与获得投资概率成负相关。
B.样本选择问题
值得注意的是,由于一些路演视频在申请过程中被设置为私密视频,或是在上传之后被删除,文章可以获得的视频只是所有视频中的一个子样本。作者以2018年-2019年7月为观察窗口,跟踪期间公开上传至网站、后续被主动删除或设为私密的路演视频。作者发现,Pitch factor或投资人的投资决策与视频是否无法被搜索到无显著联系,因此排除样本自选择问题。
结果讨论
针对回归结果,文章给出了两种可能的解释。在第一种解释下,路演视频的积极情绪预示着创始人团队的能力或企业发展趋势良好,而投资经理正确地捕捉到了这种联系并作用于投资决策。第二种解释则指出,路演视频将导致投资经理因为个人偏好(例如,我更喜欢和热情的团队合作)或判断失实(例如,这个团队很热情,因此他们的想法一定是很好的)而产生决策偏误。
A. 人际互动未提升决策质量
由于回归未控制创始人能力、团队效率等变量,因此也许是创始人积极的言谈举止所预示的团队能力、良好的发展趋势而非积极情绪本身有助于投资决策。由此,第一种解释实质上是在质疑实证模型或许受遗漏变量的影响。作者首先考察了企业的长期发展情况,发现路演视频积极程度高的企业虽然有更大的概率获得投资,但是在获得投资后的长期表现不如路演视频积极程度低的企业。此外,作者另往回归模型中引入包括创始人教育背景、工作履历、领导经历等投企业质量的代理变量,发现各变量的系数与回归

无明显改变。因此,作者认为,路演视频传递出的积极性并不能帮助投资者的决策。
B. 人际互动造成决策偏误
那么,这样的人际互动是否会带来偏见的影响?作者在文中使用性别作为检测,发现虽然Pitch factor对完全由男/女性组成的创始人团队获得投资的影响方向一致,但完全由女性构成的团队受到路演视频的影响更甚。并且,对于男女混合的创始人团队,只有男性在路演视频的视觉层面中所体现的特质与投资决定显著相关。这体现了广泛存在的性别偏见对于经济决策的影响。
C. 决策偏误的产生渠道
进一步的,本文考察了两种可能造成决策偏误的渠道:判断失实(例如,这个团队很热情,因此他们的想法一定是很好的)与个人偏好(例如,即便几个团队能力相仿,我还是更喜欢和热情的团队合作)。
a.理论模型

投资决策

由以上模型决定,即投资者j基于路演视频i所体现的特征

,对于企业成功几率的预测

,对自己所做判断的自信程度

构建投资决策。

“判断”渠道认为,µ和σ由

和路演视频的特征

所共同决定。在此框架下,视频特征

除了直接影响效用函数外(作用强度为

),也通过对投资者的判断(作用强度为

)、投资者对判断的信心(作用强度为

)而作用于投资决定。因此,文中回归结果的β 系数事实上是(

)。基于理论模型,作者设计实验以验证是否存在各渠道的效应,其中

捕捉了“判断”渠道的存在;在控制µ和σ的前提下,κ捕捉了“个人偏好”渠道的存在。

(实验设计)
b.实验设置
在实验中,作者选取在内容、时长、孵化器等方面高度标准化的62个路演视频作为视频池子,每次随机抽取其中的10个视频给参与实践的耶鲁商学院MBA学生观阅。视频i的特征被记作

,观看完视频后,参与者j被要求回答以下几类问题:(1)是否打算投资这个企业,记作

;(2)期望这个企业在未来会成功(作者在这个问题中对成功作了程度不同的定义,包括存活、成为独角兽企业等等)的几率,记作

;(3)对于自己在前两个问题所作回答的信心,记作

。整体回归模型如下式所示:

c.实验结果

(实验结果展示)
(1)条件期望P (alive|invested)随着视频整体积极性的Pitch Factor的上升而增加,证实了“判断”渠道的存在;
(2)视频特征在“判断”渠道的影响由失实判断所主导;
(3)在控制了µ和σ后,Pitch Factor仍然与投资决策显著相关,证实了“个人偏好”渠道的存在。
(4)经计算,“个人偏好”渠道带来了18%的偏误,另82%的偏误来源于失实的判断。
小结
基于对初创公司申请投资所提交的路演视频的分解,作者发现:(1)人际互动对经济决策有重要影响;(2)人际互动的个人偏好与基于刻板印象的失实判断将导致决策偏误。
文章的一大亮点在于数据与研究方法。正如作者在会议展示中所提到的,此前,视频数据的复杂性和繁重的计算负担导致其在经济学研究中未被充分利用。文中虽未穷尽对视频信息的考察维度,探寻影响机制时也只是举了两个例子,但其展现的开拓性与创新性为视频数据的应用分析提供了具有普适意义的范例。未来,不同领域的视频,视频信息的不同分解维度,甚至是其他非结构化数据的使用都将能给我们带来新的启示。
- END -
本篇summary由Yiran整理


感谢关注“人工智能和行为经济学”