概论
前言
我虽然是价值投资理念——师从查理·芒格与沃伦·巴菲特——的忠实践行者,但始终对量化投资保持着开放的态度,并积极探索其在实践中应用的可能性,以期优化投资流程并提升效率。
本书虽以詹姆斯·西蒙斯及其量化团队的轶事为主要内容,穿插了部分业内人士的故事,但其价值在于揭示了量化投资领域的一些实践经验,而非提供可以直接套用的量化策略。
多年前初识有效市场假说时,我便对其前提假设持保留态度。期权定价公式的提出者在实际操作中的失败,更印证了市场并非完全有效,存在可被利用的偏差。
书中提及了纳西姆·尼古拉斯·塔勒布的“黑天鹅”投资策略,这与我长期研读塔勒布著作的经历产生了共鸣,为我在投资组合管理中考虑极端风险事件提供了新的视角。
基于以上思考,我设想了一种结合价值投资、量化投资与“黑天鹅”策略的资金分配方案:将约二分之一的资金用于价值投资,坚守基本面分析;五分之二的资金投入量化投资,完全依赖机器算法执行,借鉴西蒙斯模式;剩余十分之一的资金则用于押注极端事件,实践塔勒布的“黑天鹅”投资理念,以期在市场剧烈波动中获得超额收益。
这样的配置既能发挥价值投资的稳健性,又能借助量化投资捕捉市场中的短期机会,同时通过小比例的“黑天鹅”投资,寻求潜在的爆发式增长。
书籍简介
作者: 忻海
出版社: 机械工业出版社
副标题: 西蒙斯用公式打败市场的故事
出版年: 2010-1
页数: 243
定价: 32.00元
ISBN: 9787111285830
内容简介
詹姆斯·西蒙斯,基金领域的拓扑学大腕,成功取代保尔森的对冲之王,20年内最佳赚钱基金经理,在投资界掀起了一场量化投资的狂潮。《解读量化投资:西蒙斯用公式打败市场的故事》用轻松、幽默的讲故事手法,解读了西蒙斯量化投资“黑箱”之内的秘密。通过深入浅出地回顾西蒙斯的投资布阵,比较西蒙斯与巴菲特投资模式的迥异,分析投资领域技术分析方法和宏观分析方法的优劣,《解读量化投资:西蒙斯用公式打败市场的故事》带我们走近了20年中平均每年总回报为80%的大奖章基金,看看它如何能将1万元变成1亿元。用数学公式打败市场,投资并非悬而未决的事情——这就是《解读量化投资:西蒙斯用公式打败市场的故事》揭示的投资之道。
作者简介
忻海,浙江鄞县人,随父母支边在甘肃兰州长大。幼时贪玩,长大以后总想赖在学校里,先后获得中国科技大学信息科学系学士、伦敦政治经济学院经济学硕士、伦敦帝国理工大学金融学博士。
博士毕业后惶惶然中,在咖啡馆偶遇瑞士银行伦敦总裁,于是在伦敦卖身瑞银十年,曾就任瑞银投资银行的外汇部和资本市场部,负责金融工程。任执行董事;现任法国巴黎银行资产管理部外汇重置业务亚太区主管、董事总经理,统领属下两人半。最得意的成就是在英国广播公司中文部任时事节目编辑和英语教学节目主播(四年),还在伦敦开过一个豆腐工厂(作坊),做出的百叶超好吃。
著有《白话金融投资》和currency Overlay:A Practical Guide(《外汇重置:实用指南》,英文版),后者是金融行业微不足道的一个子行业的权威著作,在台湾见过盗版版本。
业余喜欢排球、旅游和美食(开豆腐厂的动机)。目前居住在中国香港。
正文摘录
前言
第1章 只赚不赔的好买卖
詹姆斯·西蒙斯,拓扑学大腕,陈省身的合作者,不是一个家喻户晓的名字,但他在投资界却因量化型投资的独门套路掀起层层热浪。大“数”底下好乘凉,西蒙斯的布阵和诸葛亮的布阵有所不同。西蒙斯靠的是概率。大量的统计套利操作,外加华尔街之外的数学教授来助阵,西蒙斯的“黑箱投资’’方法靠电脑编程和自动交易,在和市场的较量中稳操胜券。他的量化投资方法究竟是神秘的还是透明的呢?
半夜吃炸鸡的大学生
西蒙斯的全名叫詹姆斯·哈里斯·西蒙斯,詹姆斯常常被人称做吉姆,这种简称在美国是很常见的。他于1938年出生在美国波士顿郊区一个犹太家庭,是家里的独子。他的父亲经营一家制鞋厂。据说很早的时候,西蒙斯就开始表现出对数字、形状超出年龄的兴趣,他说自己3岁就想学数学了。他3岁的时候有一次大人告诉他汽车的油箱开几天就没有油了,这令他十分不解,因为他认为汽车会首先用完一半的油,然后接着用去剩下的油的一半,再一半,再一半,这样下去,总会有一丁点儿油剩在油箱里面,永远也不可能用完。这当然是苏格拉底之前的古希腊哲学家芝诺的著名悖论,西蒙斯多年以后讲起这个故事的时候笑着说:“对一个小孩子来说,这个想法应该是很复杂的吧?!”在后来的采访中,他还提起小的时候曾经想过开一家电影院,因为当地只有一家电影院,或者做一个犹太教的学者。他又自嘲说,幸亏没有。是啊,如果他开了一家电影院,或者成了宗教人士,波士顿附近可能会多一间平常的电影院,或者附近的犹太教教会多一个说话慢条斯理的牧师,但是投资行业却会少一个充满传奇色彩的人物。
在波士顿附近一个叫牛顿的小镇读完中学,西蒙斯进了麻省理工学院读数学。他当年的导师数学家辛格回忆说:“西蒙斯的悟性很好,他能直观地感受到数学的原理,这是很罕见的。”西蒙斯回忆自己在大学本科时代学习很用功,课外玩起来也很疯,花最多精力的是和几个同学一起玩猜点数的纸牌游戏。要想在这个游戏里制胜必须要有很好的概率计算能力和记忆力,一般人都会觉得很头疼,完全把它当成撞大运的游戏,但是对于这几个数学系的学生来说,这正是他们放松大脑的最好办法。他们常常开夜车,玩到凌晨,然后大家挤进西蒙斯的老爷车,开到离麻省理工学院所在地剑桥镇不远的一家很有名的、半夜里仍然开门的烤鸡店大吃一顿。西蒙斯的导师辛格也常常在那里吃鸡:一边啃骨头,一边啃高深的数学问题。还不到20岁的西蒙斯觉得这种生活非常惬意:虽说导师都已经是成年人了,但是还可以半夜在炸鸡店里面钻研数学问题。这使西蒙斯非常向往。很多年里,西蒙斯都一直和辛格保持联系,过去他们是师生,后来是朋友。当时一块儿打扑克、开车吃烤鸡的有两个哥伦比亚籍同学,也都一直是西蒙斯的好朋友。学士学位拿到手的时候,西蒙斯还和其中的一个同学骑着小摩托车从波士顿一路玩到哥伦比亚的首都波哥大。
1958年,20岁的西蒙斯用了3年学完了本科,转投加州大学伯克莱分校攻读数学博士学位。其间他第一次结婚,婚礼上新婚夫妇收到的礼钱都被西蒙斯拿去投资了。他回忆说他当时觉得投资股票很无聊,就跟美林的经纪人说了自己的观点,经纪人眯着眼睛瞧了瞧这个20岁刚刚出头的年轻人,歪着嘴说:“那你就去试试大豆吧。”西蒙斯就真的投了大豆的期货。好像后来赚了钱,但是赚也赚不了很多。那时候西蒙斯还对投资、交易之类的事情兴趣不大,但是几年后就发生了很大的改变。不过,虽说当时的大豆投资似乎对西蒙斯没有什么重要的影响,他的另外一项投资却为他掘到了人生第一桶金。他和那两个哥伦比亚的同学——三个麻省理工学院的数学系毕业生——联手在哥伦比亚开了一家制造聚乙烯地板的工厂,西蒙斯的父亲帮了他们一把,为他们垫付了一笔起始资金。这家工厂的投资后来回报丰厚,卖掉股份之后拿到的钱让西蒙斯交给别人投资在金融市场,很短的时间里面就暴增10倍,这很可能是西蒙斯走出学院的象牙塔、闯入金融行业的一个重要的原因,不过这是后话。
拓扑和越战
三年以后西蒙斯就拿到了博士学位,回到母校麻省理工学院当老师,那时他才23岁。他的博士学位导师回忆说:“吉姆是个很有独创性的人,喜欢坚持走他自己认定的道路。”他的博士论文有关多维弯曲空间里面的几何问题,和后来以西蒙斯和华裔著名数学家陈省身联合命名的陈——西蒙斯理论一样,都属于拓扑几何学的范畴。曾经有一个记者不小心请西蒙斯解释陈——西蒙斯理论,西蒙斯给他讲了半个小时,讲完之后记者后悔不迭:问了这个问题,耽搁了有限的采访时间,因为虽说经过西蒙斯半个小时的解释,但他仍然是一头雾水。当时西蒙斯选定博士论文方向的时候他的导师很担心,觉得他选了一个难啃的骨头,但是西蒙斯用了不到两年就解决了那个问题。
在麻省理工才待了一年,不安分的西蒙斯又跳槽到麻省理工隔壁的哈佛大学当数学老师。干了两年,1964年,他又走人了。这次他没有去另外一所大学,而是加入了美国国防分析研究院。这个机构是一个地位比较特殊的非营利性研究机构,从国家拿钱,专门为美国国防部和其他政府机构提供各种服务。它的前身是1947年国防部出资成立的武器系统评估小组,20世纪50年代中叶,国防部请麻省理工学院出面成立一个非军事编制的科研机构,聚拢全美科技精英,为国防部解决棘手的技术问题。西蒙斯当年的工作是破译各种密码。他这次换工作的主要原因是钱,国防分析研究院的工资要比年轻的大学教授的收入高很多。另外,西蒙斯当时研究的几个拓扑几何的项目都没有什么突破性的进展,这使他感到很沮丧。去国防分析研究院,工资上一个档次不说,西蒙斯只需要花一半的时间替国家安全局破译密码,而另一半的时间他待在国防分析研究院设在普林斯顿大学的研究中心,在这里他可以继续考虑他的拓扑问题。
从1964年开始,在肯尼迪总统遇刺之后接任的林登·约翰逊总统的主持下,越战不断升温,地面攻势在1965年1月31日之后愈演愈烈,美军的参战人数和死伤人数都不断增加。尽管约翰逊总统对美国国内媒体采取高压控制的措施,限制各种负面的报道,但是美国国内反战情绪日益高涨,1967年五角大楼前的大型反战示威活动中有600多名示威者被逮捕。这期间破译密码的西蒙斯肯定是非常忙碌的,他也不会没有意识到他的日常工作和遥远国度里正在进行的那场战争之间的关系。1967年,西蒙斯的老板、国防分析研究院的总裁泰勒将军在纽约《时代》杂志上撰文力挺越战。泰勒将军过去是美国参谋长联席会议的主席,军中的重磅炸弹。但是西蒙斯并不买账,他给《时代》杂志写信说:“其实我们在国防分析研究院工作的一些同僚和他的观点迥异。如果要遵循一个理性的国防策略,那么目前唯一的出路是以最快的速度撤军。”
不久之后,泰勒将军就解雇了西蒙斯。
那是1967年,西蒙斯29岁。因为结婚早,他已经是三个孩子的父亲了。
长岛石溪
在凶险的“江湖”上铩羽而归,西蒙斯只好重新回到大学校园的象牙塔里面。这时候刚刚成立才10年的纽约州立大学石溪分校(又称石溪大学)正在招兵买马。石溪大学是纽约州立大学的四个大学中心之一,位于纽约市东面,长岛的北岸,距曼哈顿约105公里。1966年,著名华裔科学家、诺贝尔奖得主杨振宁应聘到该校任教,引起不小的轰动。1967年,西蒙斯接受了校长陶尔的邀请,出任该校数学系主任。他回忆说:“之前在国防分析研究院我是个喽啰,被人挤来挤去,最后一脚踢开,自己一筹莫展。但是当了系主任,要解雇我就没那么容易了。说一千,道一万,还是要当自己的老板。”这个想法自然为他日后离开学术界在金融行业独自打拼留下伏笔。
西蒙斯在石溪大学待了8年。在这期间,他不仅仅和陈省身创立了著名的陈-西蒙斯理论,而且使这个新成立大学的数学系的拓扑几何研究在全美名列前茅。虽说我们这本书的话题跟拓扑几何学相差十万八千里,我们不会花时间去细究这个系究竟有哪些高手和绝招(作者随便翻了一两篇该系教授的论文,不仅完全不懂论文的题目,而且看了一两页之后连最基本的内容都猜不出来。),但是多了解一些西蒙斯是如何让这个系从无到有、从有到精的过程也许能为我们提供关于日后大奖章基金运作的一些线索。在接受聘书之前,他已经和学校谈好了将来聘请其他教授的各种条件,包括工资、教学任务、休假时间和他们从事研究时应该得到的协助等。之后,他想尽办法,不分远近,请到了一些当时或者后来的学科领军人物,这些人分别来自德国波恩大学、美国密歇根大学、前苏联的列宁格勒大学,等等。很早以前,西蒙斯就认定任何项目成功与否最关键的因素只有一个,那就是人。其间,西蒙斯请到的另外一个人是纽约康乃尔大学的数学教授、他读博士期间的同学詹姆斯·埃克斯,这个人将在西蒙斯的投资生涯中起到重要作用,关于他我们回过头再说。
1974年,西蒙斯和加州大学伯克莱分校微分几何学的顶尖人物陈省身共同发表了一篇非常重要的论文,这篇突破性的论文提出的理论就是人们常常提到的陈——西蒙斯理论。微分几何学研究的是有关弯曲的表面和空间的各种问题,和拓扑学有很多交叉之处。陈——西蒙斯理论和著名的庞加莱猜想(现在已经成了庞加莱定理)有一定的关系,西蒙斯自己就曾经说过“陈——西蒙斯理论为证明庞加莱猜想提供了一条艰难的途径,虽然也还有其他若干条艰难的途径来证明该猜想”。庞加莱猜想是2000年著名的克莱数学研究院出资100万美元悬赏答案的七大数学难题之一,由法国数学家庞加莱1904年提出。这个定理可以通俗地表述为:一个没有破洞的三维物体和一个三维的球体是拓扑等价的。拓扑等价的意思就是说你可以想象两个物件的表面是像气球一样的薄膜,怎么撑拉都不会破,如果你能把其中一个通过撑拉,变成另外一个的样子,那么它们就是拓扑等价的。所以,人们在说起拓扑学的时候还有一个通俗定义,说它是有关带把儿的茶杯,是和中间有一个洞的炸油饼相同(即“拓扑等价”)的学科,因为这两样东西可以通过撑拉变成同一个模样,都是中间有一个洞的三维物体。所以,庞加莱猜想是说:任何形状的气球,只要没有破洞,就可以撑成一个圆的气球。听上去很简单吧?这让几代数学家挖空心思想了整整100年,到2002年才被一名俄罗斯的怪人数学家证明,但是这个怪人数学家拒绝接受克莱数学研究院的奖金,这其中的故事还牵扯华裔数学家丘成桐、丘的学生曹怀东等人,有很多的指称和反指称,谁先、谁后证明了庞加莱猜想,谁抄袭了谁,谁缺乏起码的学术道德,等等,足够写一部电视连续剧的材料,这里我们就不提了,值得一提的是庞加莱的定理在三维以上的空间很早就被证明了,反而是简单的三维体让几代数学家备尝艰辛——很多事情都是如此,貌似简单的东西令你殚精竭虑,貌似复杂的却能手到擒来。
我们生活的空间是三维的,如果把时间也算成一维,那么空间是四维的,五、六甚至十维的空间到底是什么样子呢?一般人很难想象,有人说那里都是鬼住的地方,但多维空间对于西蒙斯来说却是轻车熟路。陈——西蒙斯理论讨论的也是类似庞加莱定理的东西,但要把它表述成日常生活里的概念却很难。最近20年,该理论被应用在很多领域,其中比较重要的是关于宇宙起源的超弦理论和黑洞理论,陈——西蒙斯理论在天体物理中的应用被称为陈——西蒙斯量子场理论,但是西蒙斯本人在这过去20年关心最多的却不是宇宙的起源,而是如何赚钱。从后来有关西蒙斯如何赚钱的各种资料来分析,他的赚钱方法和十维空间的拓扑理论基本没有什么直接的关系,西蒙斯自己在接受采访的时候也提到他过去的研究和后来的投资毫无直接联系。但是,虽然直接的关系没有多少,间接的关系应该有很多,关于这一点我们稍后可以从复兴技术公司的投资理念中看出来。
在石溪大学任数学系主任期间,西蒙斯的生活也出现了一些变化,他和第一任妻子芭芭拉分手了。随后,他和经济系的研究生玛丽琳相爱。玛丽琳成为他的第二任妻子,帮他照顾他的三个小孩,他们后来又有了两个孩子。
西蒙斯卖掉了在哥伦比亚的聚乙烯地板厂的股份,得到60万美元,这在1974年是一笔不小的财富。西蒙斯把这笔钱交给了他在哈佛任教时候的学生查尔斯·佛莱菲尔德去投资商品市场,不到7个月,由于糖的价格暴涨,西蒙斯的投资从60万美元变成了600万美元!也许是因为这个意外的惊喜,西蒙斯又回想起了自己数年以前投资大豆的经历,他对于交易和投资的兴趣又开始复苏。虽说他在学术上的成就已在那个领域独领风骚,但他还是开始慢慢移情别恋。后来他自己说“学术界的节奏太慢了”。而另外一个原因是西蒙斯研究的数学领域出成果很难,需要很长的时间,最后的成果有时候还要靠相当的运气。这都使西蒙斯感到沮丧。1976~1978年间,他仅将一半的时间花在十维空间里面,另外一半则花在变幻莫测的外汇和商品市场上。
从判断型到量化型
刚开始的时候,西蒙斯的投资方法和许多人类似:通过对宏观基本面的分析来判断外汇和商品的价格走势,然后进行相应的买卖。虽说我们找不到西蒙斯当年的投资记录,但是投资开始还没过两年,西蒙斯就决定完全离开校园,全职进行投资活动,就此分析,西蒙斯刚开始的时候就应该是赚钱的。1978年,他完全脱离了石溪大学,成了专业投资人。他成立了一个叫林姆若伊的基金,专门从事各种投资,其中主要是外汇交易,但是也包括投资各种小公司的现在统称创投基金的投资活动。10年间,林姆若伊基金的投资回报是25倍,相当于每年增长38%左右,这和后来西蒙斯管理的大奖章基金的回报差不多。那时候西蒙斯还是花很多时间来关注宏观经济事件,比如美联储什么时候加息啦、加息之后美国债券的长期利率和短期利率都分别会有什么变化啦之类的东西(在很多国家,中央银行只是间接控制政策利率,其他利率是由市场机制决定的。)。他当年的投资方法是判断型的,直到10年以后的1988年,大奖章基金鸣锣开张,西蒙斯的投资方法才完全转型,从判断型转到量化型。
这里我们要岔开话题,说说投资方法都有哪些类型。其实分起来也很容易,按照投资决策的方式,可以分成判断型和量化型两类。判断型投资者根据各种信息以及个人过去的经验来确定买卖什么、买卖多少、什么价位执行、交易如何退场(止损、止盈)等,这里面最有代表性的人物正是西蒙斯在纽约的邻居索罗斯。股神巴菲特也应该算是判断型的投资者。判断型的中心枢纽是人的大脑。各种信息进了大脑,出来的是买卖交易指令。同样的信息进了不同人的大脑,出来的很可能是不同的指令,因为我们每个人的经历不同,个性和性格不同,判断的方法不同。科学发展到今天,人类能够登天入地、克隆猪羊,但是对自己大脑的了解还是非常有限的,人的大脑可以说是一个典型的“黑箱”。不过,有趣的是,投资行业一般把量化型的投资称做“黑箱”。简单来说,量化投资者不依靠大脑的判断,而是靠数学公式来投资。比如:量化投资者把最新的市场及其他相关信息输入到他的秘密公式里,公式得出的结果说买中石化,量化投资者就出去买中石化。过了一段时间,一天或者个把月,也可能是几秒之后,量化投资者又把最新的信息输入他的秘密公式,公式的结果说卖中石化,量化投资者就卖了。量化投资者和判断型投资者的最主要的区别在于,不用判断,而是完全依照公式。公式的好处是它的一致性:同样的信息输入同样的公式,得出的结果是一样的,跟输入的人是谁没有关系。西蒙斯正是量化型投资者的代表,但他不是唯一使用量化型方式投资的人。索罗斯、巴菲特和西蒙斯这三个人或许可以算是投资行业的福、禄、寿三星,他们使用完全不同的两类投资方法也说明这两种方法到目前为止还不能说哪一种更好。但有一点是明确的:量化型的投资方法还很年轻,它的发展壮大也不过是最近30年的事情。
投资方法还可以根据投资决策所凭借的信息类别来分,分成基本面型和技术型两类。基本面型的投资方法按照宏观经济或者公司盈利的各类指标来进行投资决策,而技术型的投资方法则一般是按照过去的价格走势来判断的。也有许多投资方法既不靠基本面,也不靠过去的价格走势,为了定义的严谨,我们把任何使用非宏观经济指标和公司营运指标来分析投资的方法都归入技术型投资之中。比方说,有不少人是按照星象来投资的,这在我们的定义中算技术型投资。20世纪80年代中期,有人是根据东京街头流行的超短裙究竟有多短来投资日元的,据说这在当年给追随这种策略的投资人带来很高的回报(和眼福),这也勉强算技术型吧。
据2007年的统计,全球70%的钱都是凭借基本面型的投资方法来操作的,30年之前,这个比率应该超过90%。技术型、量化型的投资虽说可以溯源到20世纪初,但是它们的发展和壮大是近30多年的事情,尤其是使用数学工具和电脑的量化投资方法。在过去的20年间,世界很多著名大学的毕业生纷纷选择金融机构的量化分析师这样的工作,他们学的专业常常是统计、数学、天体物理、量子物理、流体力学和电子计算机。目前,使用量化方式进行投资的各类基金和其他机构所管理的资金数额估计占全球投资总量的20%,在全球很多大型的股票交易所中,接近50%的交易量可以说来自各类量化投资的方式。在金融危机的影响之下,很多投资行业受到影响,但是量化投资(包括指数投资)仍然是基金管理里面增长最快的一个部类。
综合上面两组分类方法,投资方法可以细分为基本面判断法、基本面量化法、技术判断法和技术量化法。索罗斯和巴菲特都应该属于基本面判断法,从目前了解的信息来判断西蒙斯属于技术量化法。技术判断法的追随者很多,它有另外一个名字:技术分析法,或者图线法,书店里有大量的书籍,很多投资机构也有专门的技术分析师对各种金融价格进行短、中、甚至长期的技术分析预测。从“移动平均”、“K线”到“支持区”、“阻滞区”到“双肩架一头”等,这个行当的名词跟金庸的武打小说有一拼。人们对技术分析这个行当的态度其实也类似于对金庸小说的态度:有人说好得不得了,有人则不屑一顾,认为这和占星术没什么不同。其实这类投资方法和西蒙斯的大奖章基金有很多相似之处,西蒙斯的林姆若伊基金在1978~1988年之间的投资方法很大程度上都可以归于技术判断方法,后来的大奖章基金也可以说继续走技术型投资的道路。但是大奖章基金的操作方法和许多靠技术分析进行投资的个人的主要区别是西蒙斯完全用电脑来进行操作:从画线、到判断、到下单、到交易、到跟踪、到平仓,而一般人则是在电脑的价格图上画线,然后估测分析,然后打电话给经纪人下单,然后经纪人打电话回来说交易是不是做成了。这样的速度,用西蒙斯的话说:“黄花菜都凉了。”好吧,西蒙斯没说过这话,但是我们后面会看到,西蒙斯能够长盛不衰的原因之一是他的速度。另外一点,技术分析法也是需要判断的,同样的价格图让不同的人去分析得到的可能是完全不同的结论,而西蒙斯的量化分析得到的则是同一个结果。
大部分个人或者机构的投资方式都可以归为宏观判断型,但是如同现实生活中的其他事物一样,绝对的分类并不常见,常见的是各种分类的混合体。投资方法也是这样:很多人都以宏观为主,夹杂一些技术;一般凭借感觉和判断来进行决策,但是在今天的社会,很少有投资人完全不看各种计量分析的结果,所以决策也多少有些量化的味道。
一天是英雄,另一天是狗熊
黑箱究竟有多黑
数学教授们
长线钓大鱼,短线钓的是“热土豆”
大“数"底下好乘凉
西蒙斯的布阵和诸葛亮的布阵有所不同。按照书上的说法,诸葛军师的布阵基本上是百战百胜的,就连他死后事态的发展也是按照他生前的布阵来进行的,而西蒙斯布阵的目标成功率可能只有百分之六七十,有时候,哪怕稍微比掷硬币得出的50%高一点儿的话西蒙斯也有可能去做,这就牵扯到套利和统计套利的概念。
套利的概念最早是应用在外汇市场上。给你三种汇率:人民币兑美元,人民币兑日元,美元兑日元,这三种汇率之间不是毫无关系的,因为通过任何两种,你就可以换算出第三种。如果市场上交易的第三种汇率水平和通过另外两种汇率计算出来的汇率不同的话,那就是一个潜在的套利机会。换句话说,你有可能可以通过买卖一定比例的这三种货币,稳获一定的回报。我用“潜在”和“有可能”这样的词是因为你要考虑到支付各种交易的手续费,考虑到如何解决某些货币(比如人民币)可能存在的管制,诸如此类的问题。如果你做了买卖之后不管后来汇率如何变动你都稳稳当当地赚了钱,这就是套利操作,它是指利用市场上不同价格之间的不正常之处进行牟利。
套利的关键是要走在别人前面,因为套利的过程也正是价格恢复正常的过程,比如两个相关的东西一个价钱高一个价钱低,套利操作就是卖出高价的买入低价的,这样高价的东西就会降价而低价的东西就会升价,最后,价格恢复正常。或者也可以这样说:套利操作使价格更为合理。你可以把套利操作使用在金融领域的任何角落:各种债券之间的套利,在两个不同的股市上市的同一只股票之间的套利,现货和期货之间的套利,等等。套利的一个最基本特征是它的收入是保证的,套利操作没有赔钱的风险。正是因为套利这样好,所以套利机会在现实生活中很少见到。对于一般的投资者来说,套利的机会和地上捡到钱的机会差不多大,因为如果有什么机会的话,那些天天盯着市场的人早把它套没有了。因为套利是没有风险的,所以你可以想象找到套利机会的人会把所有的钱(包括借的钱)拿来进行套利操作,还可能招呼所有他认识的人来套,所以不合理的价格应该会很快改变的。
正是因为如此,现代金融理论的一个基本出发点是“无套利原则”。也就是说,在通常情况下,你可以假定市场上不存在套利的机会,没有风险的超额回报是不存在的。2000年西蒙斯在接受采访时被问到当时的金融市场和复兴技术公司刚刚成立的时候相比是不是“更为有效”了,这个“更为有效”的意思就是指不合理的价格更少了。西蒙斯回答说:“的确是有效多了。从前我们交易美国国家债券,我们留意了各种不同到期日的债券,它们的回报率各有不同。我们发现里面大有文章:远期债券的折价很高,12个月到期的债券则没有这样的折价。我们觉得这里面肯定有不对劲儿的东西。现在这样的价格异常会被像长期资本管理公司这样的投资公司在瞬间消除掉。当年我们将这个异常情况看了又看,我们认定市场还没有人发现这个问题。于是我们买了一大笔长期国债期货,做了该做的对冲,然后就屏住呼吸,等着折价消失。不出所料,没过多久,不合理的折价就消失了。但是像这样的机会现在不存在了。过去商品市场的趋势性很明显,常常有比较长时间的趋势,现在也没有了。”西蒙斯谈到的有关国债的折价异常就是一个套利的机会。
统计套利的意思是说某种交易不是完全没有赔钱的风险,所以按照定义不能算做纯粹的套利,因为套利是没有风险的获利;但是从数据分析上来看,这种交易获利的可能性比较大,所以平均来说这种交易是可以获利的,因此叫统计套利。也就是说,同样或者类似的交易,你做一笔既有可能赔钱也有可能赚钱,不能叫套利;但是如果你做上十笔八笔、千笔万笔的话总体来看赔钱的可能性很小,赚钱的可能性很大,这类交易就叫统计套利。统计套利的原则来自统计学里的大数原理:从一个群体里面抽样平均来计算整个群体的平均值,比方说人的身高的平均值吧,如果随便选几个人来计算,得出的平均值可能不是真正的平均身高,但是如果选的人越多,高高矮矮可能互相抵消,算出来的平均值就越来越接近真正的平均身高。从这个意义上讲,西蒙斯的交易模型似乎应该是属于统计套利(但是在对冲基金行业中,统计套利常常被用来特制同时买入和沽空两只或者多只相关股票的投资策略,我们后面也会看到,这类策略也是大奖章的主要投资策略之一。我们这里所说的统计套利的概念面比较宽。)。
“毛"和“净”,猴子和花生米
西蒙斯的压水花技术
看起来大家津津乐道的有关大奖章基金收费超高的话题只不过是西蒙斯控制基金规模、优生优育的一个举措。因为基金的投资人都是自己人,所以管理费、表现费想收多少就收多少。事实上,除了超高的收费之外,大奖章基金最近几年还将基金的现金拿出一部分来返还给投资者。为什么呢?这个问题的答案主要在于流动性。
流动性这个词在金融行业里经常被人提起,也没有什么确切的定义。2007年开始的这场金融危机刚刚开始的时候叫“信贷危机”或者“流动性危机”,意思是银行不往外借钱了,所以大家都钱紧,引起整个社会经济增长受制。流动性通常的意思是指整个经济中的各种各样的钱,包括现金,但是更重要的是贷款、存款等。关于这场金融危机的起源,也有人说是因为2000年以后美国的利率太低,所以流动性过高,这个流动性是同样的意思,指钱的多少。我们现在所说的流动性跟上面的说法有关联,但是不完全一样。这里的流动性指的是某种金融产品有没有足够的交易量;或者说:如果你去买卖这种金融产品的时候会不会对交易价格产生过大的影响。如果某种金融产品的交易量够大,你进去大笔买入或者抛出的时候价格自然可能会随之起落,但是不会太大,价格变化是在可控制、可预见的范围之内的,我们可以说这种金融产品有足够的流动性。流动性最高的金融产品是外汇,外汇里面流动性最高的是欧元对美元的现货交易,每时每刻都有千百笔交易,每天的总交易额巨大,以万亿美元计,西蒙斯如果去买卖欧元美元的话应该没有什么问题。其他大货币之间的外汇交易也是流动性很高的,新兴市场的货币交易流动性相对差一些。在债券方面,一般各类国债的流动性都比较高,公司债稍差。国债里面,美国的国债流动性最高,所以投资人包括许多国家的中央银行有闲钱的时候都愿意放在美国国债里面,变现很容易。股票里面大公司的股票(蓝筹股)流动性较好,创业板的股票相对较差。很多投资人都有这样的经验:看着某只创业板的股票价位很吸引人,但是如果你想冲进去买个10万、8万股,股价就有可能突然飙升一两个档次。你可以想象像大奖章基金这样的资产数十亿美元的投资基金如果冲进去的时候情况会如何。流动性大小就像一个游泳池的大小和深浅,我们可以想象一个高台跳水运动员,从10米跳台纵身跃下,她压水花的技术很好,但是如果游泳池的长宽只有两米乘两米大,再好的压水花技术也免不了溅人一身水。更糟糕的是,如果跳下来才发现水深只有两米,后果则不堪设想。像西蒙斯这样的投资人还真有些像跳水运动员,他们的目标是把水花压到最小,别人不会注意到他们的举措,这样他们就可以冲进水里抓鱼。这里面有一个问题:游泳池的大小和深浅是你事先很难准确估计的,所以任何投资都包含着一定的流动性风险。常常有人说:流动性对投资的限制就好像是高速公路上的限速对普通开车人的限制,等到你发现你过了限速的时候常常已经被雷达抓到了——尤其是在你事先不知道限速究竟是多少的情况下。
西蒙斯基金能够领跑很多同行的原因之一就是它对流动性风险的把握要比其他基金公司高明(流动性风险对于巴菲特不是不重要,比如,他出售中石油股份的时候就要考虑到市场能消化多少,折价多少才能出手,但是他在大宗股份出售的时候一般按照市价折让几个百分点就可以了,跟他赚到的百分之六七百的回报比很小。而西蒙斯每一笔生意的目标回报可能只有一两个百分点或者更低,所以流动性折价很关键。),管理流动性风险对西蒙斯的投资策略而言是生死攸关的大事。我们前面已经说过,在1989年西蒙斯决定专注于短线投资的战略,这就决定了西蒙斯必须要在短期内买卖很多各类产品。这和索罗斯、巴菲特的投资方式迥异,索罗斯、巴菲特这两个同岁的老头麾下的基金一年之中的交易笔数可能比不过西蒙斯的大奖章基金一天的交易笔数。所以,西蒙斯的各种数学模型必须要考虑到流动性,要考虑到交易成本,因为流动性是决定交易成本的一个重要原因:市场的价格如果因为你的买卖而大幅度变化就意味着你的卖价降低、买价升高,你的交易成本增加。
在投资运作中,西蒙斯采取各种措施来控制流动性风险。比如,大奖章基金投资的金融产品都是流动性相对较强的、公开交易的产品。基金的部位很分散,包括全球各地交易的各种金融产品,每个交易的数量都有限。过去,西蒙斯一直雇用很多非常优秀的交易员来以最快的速度和最低的成本完成模型计算出来的交易,最近10年里面,复兴技术公司又投入大量的人力物力财力来加强、完善电子交易的流程和系统。20年前西蒙斯刚刚成立公司的时候把它叫技术公司是很有远见的,因为现在的成败在相当程度上都不仅仅是数学模型的成败,而是技术的成败。
我们在这里暂时跟大奖章基金道别,下一章先去说说另外一个同样名声赫赫的基金,这个基金凭借量化投资技术出名,但是后来身败名裂,几乎把整个美国金融系统都拉下了水,然后我们再来窥视大奖章基金成功的秘密。
第2章 四千六百个诺贝尔奖
如果投资行业也算是一种江湖,如果这个江湖也有什么秘籍的话,那么最大的秘籍——相当于《九阴真经》、《葵花宝典》和《武穆遗书》的合订本——的作者就是两个貌似平常的大学教授默顿与舒尔斯,他们与有着“华尔街最牛的牛人”和“华尔街套利之父”之称的另一个顶尖高手梅里韦瑟联手,想要使量化投资独步江湖。
“华尔街最牛的牛人”
1997年,瑞典皇家学院把当年的诺贝尔经济学奖授予了“为金融衍生工具找到新的定价方法”的美国经济学家罗伯特·默顿和麦伦·舒尔斯。当消息传到美国的时候,默顿还在哈佛的教室里面给学生上课。学生们全体起立,鼓掌三分钟,向他表示祝贺。默顿以他一贯的沉稳和睿智的神态向各位点头致意,他说:“如果有人认为既然现在能够测量投资风险,那么我们就可以将风险完全去掉,这实际上是错误的观点。”等到这一章的故事讲完之后我们就不难看出这句话的讽刺意味。而当时舒尔斯正好在接受加拿大一家报纸的采访,当记者问他有没有觉得自己对1987年的股市崩盘感到有些责任的时候,舒尔斯吃了一惊。他说:“我不认为跟我有任何关系,就像你不能因为诺贝尔发明了炸药而把第一次世界大战的责任推到他头上一样。”当时有一些研究显示,1987年的股灾一部分的原因是很多金融机构采用了布莱克-舒尔斯-默顿的理论,在股价上涨的时候自动买入,股价下跌的时候自动抛售造成的,这种做法叫“投资组合动态对冲”,也叫“投资组合保险”,后面我们还会专门介绍。舒尔斯接着对采访他的记者说:“我们目前所做的,是在全球范围搜寻投资产品,按照我们的量化模型来判断,这些产品要么价值被高估,要么被低估。我们会相应地卖或者买这些产品。对于其中我们不太了解的风险,我们则进行对冲。”舒尔斯所说的“我们”指的是一家跟复兴技术公司类似的基金公司,叫长期资本管理公司,它成立于1994年,舒尔斯、默顿都是这家公司的合伙人。这两位获得诺贝尔奖一年以后,1998年,长期资本管理公司在4个月中赔了46亿美元。因为该公司和各大银行之间有千丝万缕的交易关系,为了避免公司破产造成美国甚至全球金融业的混乱,美联储出面组织了十余家全球最大的银行注资将近40亿美元,接手了长期资本管理公司。两位诺贝尔奖得主都曾当众为此流下过眼泪。
要说清楚长期资本管理公司从辉煌到灰黄的故事,以及它和量化投资的关系,我们要把时针再往回拨几年,从川妹子看到的第三个老头说起。他的名字叫约翰·梅里韦瑟,除了被叫做“华尔街最牛的牛人”之外,他还号称是“华尔街套利之父”。
按照我们这本讲量化基金的书的标准来说,梅里韦瑟的学术背景基本不值一提,尤其是放在许多得过诺贝尔奖或者有以他们自己的名字命名的定理或者理论的人面前。梅里韦瑟于1947年出生在芝加哥,他在美国伊利诺伊州的西北大学毕业,获得数学学士学位,之后又在芝加哥大学获得工商管理硕士。虽说这两所大学的名头都不小,但是梅里韦瑟再怎么说也只是个工商管理硕士,远远不能算是一个“量化专家”。不过,话又说回来,那些过去被金融界取笑,认为只能待在大学校园里面高谈阔论的博士、教授之类的人物后来能够大规模走进华尔街,被称为金融量化专家成为金融行业的一个重要组成部分,梅里韦瑟在这个过程中起了非常关键的作用。
梅里韦瑟出生在一个传统的中产阶级天主教家庭,父亲是会计,母亲在地方政府的教育部门工作。他从小数学就不错,在学校里面人缘也不错。但是如果他的内心里有什么事情,他很小就学会在外边不露声色。很多年后在尔虞我诈的华尔街,他的竞争对手仍然无法从他的脸上找到他内心活动的任何线索。跟许多成功(和更多失败)的投资人一样,他小时候就喜欢赌博。他和他后来的老板在银行交易大厅曾经为一千万美元打过赌,这个事件也是金融行业中《一千零一夜》(如果有的话)里面长盛不衰的传奇故事之一。但是,用“赌徒”这个词来形容梅里韦瑟却是非常不恰当的,因为他的谨慎是出名的。他豪赌的时候一般都是他很有把握的时候。中学的时候他勤工俭学,在一家高尔夫俱乐部给人家当球童,其中的一个富人会员推介他申请一个专门为球童设立的大学奖学金,所以说,高尔夫球是他能够继续读书的契机。学士毕业以后,他在中学教了一年的书,然后选择继续深造,在芝加哥大学读硕士。他当年在芝加哥大学的同学里面还有日后曾经当过美国投资银行高盛银行的主席,现任美国新泽西州州长的乔恩·科尔津。他们还将是华尔街上你死我活的对手,不过那是后话。1973年,西蒙斯还在石溪大学当系主任的时候,27岁的梅里韦瑟被招进所罗门兄弟的债券部。所罗门兄弟是华尔街的一间投资银行,成立于1910年,1990年被旅行者集团并购,后来又合并到花旗银行之中。1973年的所罗门还只是华尔街的一个小角色,不能说是跑龙套的,但绝对谈不上是大腕。那时这家银行正蓄势待发,这里面的关键人物就是那一年加入该银行的梅里韦瑟。他圆圆的脸上有两个酒窝,半笑半不笑,一双眼睛永远令人猜不透。20世纪80年代,所罗门兄弟成了华尔街的山大王,这个金融帝国曾经令对手望而生畏,它的债券部门更是无人匹敌,而所罗门兄弟债券部的大印就掌握在梅里韦瑟的手中。1991年,所罗门兄弟在美国国债市场违规投标,企图操纵市场,这一事件使所罗门兄弟受到致命一击,几年之后它被兼并也不过是当时那次事件的一个小脚注。不用说,梅里韦瑟又是站在那个国债丑闻的旋涡中央。之后的1998年,在那个可能导致美国金融体系瘫痪的旋涡中间站着的,还是他。
变化和机遇
下“套”
对冲基金的兴起
把控制风险从靠天吃饭变成靠自己吃饭
超级团队
妙笔生花的杠杆
屡战屡胜
风险管理:从艺术到科学
新方向
正态和肥尾
我们先说说长期资本管理的投资策略之一——股票期权套利,这跟两位诺贝尔奖得主得奖的课题息息相关。我们前面说过,按照布莱克-舒尔斯-默顿的理论,在一定的条件下,各种期权的价格可以按照他们的公式精确地计算出来。这里所说的“一定的条件”有好几条,有的技术性比较强,我们不去细究。大致地说,其中包括:金融产品的交易是分分秒秒连续进行的(所以叫连续时间金融学);价格也是连续变化的,产品的价格变化用百分比来表示应该是正态分布的(如果价格变化的百分比是正态分布的,那么价格变化的本身是“对数正态分布”的,在本书中我们没有去细究究竟是哪一个。);前一秒钟的价格变化和后一秒钟的价格变化之间没有关系;最后,正态分布的标准差是固定的、不随时间而变化的。
交易的连续性保证了价格的连续性,这种连续性的假设对于得出准确的期权价格是重要的。但在实际交易中,交易自然不是连续的,因为股市会收市。价格变化也不是连续的,有时候在一笔大宗交易完成之后,价格直接从一个价位跳到另外一个可能相差较远的价位,这叫市场跳空或者叫价格跳空,这使得期权的实际价格和公式给出的价格有异。不过这两个假设还不是最致命的弱点,在实际交易中,交易商通常用各种方法来对这两个假设进行补偿。
关于价格变化是正态分布的假设比较致命,与实际的出入也比较大。正态分布是我们现实生活中经常遇到的分布:随便抽样一组人的身高,你可以得到一个平均值,大部分人的实际身高都在这个平均值的附近,离平均值越远的身高出现的可能性越小,姚明和侏儒都不常见。如果你把各种身高出现的概率画一条曲线,横轴是身高,纵轴是概率,那么你就会得到一条平常所说的钟形曲线:两边向下,中间凸起,像一个大钟。自然界和科学研究中的许多现象都可以用正态分布来表述:人的身高、智商,海浪的大小,激光的强度,等等。再比如,掷骰子,每次只有6种可能,从1点到6点的概率一样,你连续掷10次,然后把10次的结果加起来会得到一个总和,这算一次实验;如果你将这个实验重复很多次的话,这个总和的分布也将接近正态分布,得到最大值60点(连续10次掷到6点)或者最小值10点(连续10次掷到1点)的可能性都很小,而很多的总和都将接近于平均值35点。一般说来,如果某种现象的出现取决于很多很多种互不相关的因素,那么这种现象就很可能是呈正态分布的。根据这一点,把金融价格的变化假定为正态分布似乎很有道理,因为这些价格都是受到各种因素的影响,在各种交易人之间进行的交易过程中不断变化的。正态分布也叫高斯分布,得名于德国数学家高斯。顺便插一句,高斯并不是第一个使用这个概念的人,这种“名不副实”的现象在科学发明中屡见不鲜,还专门有一个“定理”来概括这种现象(斯蒂格勒定理(Stigler’sLaw):所有的科学发明都不是以真正的发明家命名的。)。在统计学各种各样的概率分布里面,正态分布应该算是最漂亮、最简洁的分布,计算起来也很方便,就连掷硬币的0——1分布也没有正态分布这样直接、好用。
确定一个正态分布只需要两个数字,一个是平均值,另外一个是标准差。标准差代表一个正态分布相对于平均值有多分散,也就是每个人离平均值有多远。如果测量军队仪仗队每个士兵的身高并和平均值比较,标准差就会很低;但是如果去测量街上随便找来的一群人的身高,和平均值比较,标准差就会相对较高。对一个正态分布来说,大约2/3的抽样结果都应该在离平均值一个标准差以内的地方。标准差在金融投资行业中经常被称做波动性,一般是由一个百分比来表示的。比方,有人会说:“最近市场风险加大,标准普尔500的波动性从平常的15%上升到了30%左右。”30%的波动性意思是:“如果你认为美国股票的未来变化是正态分布的话——通常大家都这样假定,所以这个假设就不单独提出来了——那么一年以后有2/3的可能性标准普尔500的水平会在目前水平上下30%的范围之内(其实严格地说不是在目前水平,因为要考虑到一年之内标准普尔指数成份股的红利率和一年的政府债券利率,但是我们在这里忽略这个细节。)”。不仅如此,你还可以推算出,一年以后标准普尔升降超过50%的可能性是10%,它猛涨100%的可能性是0.04%,等等。
细心的读者可能会发现,这些数字看上去跟两位长期资本管理的教授给投资者的信中的话有些类似。其实这不需要高深的数学,一个中学生用制表软件上附加的正态分布公式几分钟就能算出来。两位教授之所以能给长期资本管理将来的亏损大小和概率给出貌似精确的预测,也正是基于这样的假设:价格的变化是正态分布,盈亏也是正态分布的;同时,过去的波动性和将来的波动性一样。在金融投资中,一般大家都把波动性和风险等同看待,殊不知这里面包含着一个非常美好诱人但也是非常危险的假设:价格变化是正态分布的。
在正态分布的假定下,布莱克-舒尔斯-默顿的公式将期权的价格和金融产品价格的波动性直接挂钩:如果你知道未来波动性是多少,那么你就能知道期权的价格,反之,如果你知道期权的价格,你就知道未来的波动性是多少。因为期权的价格是由市场买卖形成的,所以期权的价格其实成了整个市场对未来价格波动性的预测。正是这个原因,他们的公式和理论常常被认为是对风险进行标价的公式和理论。
黑天鹅飞来了
将公式应用到实际投资里面,两位教授和其他长期资本管理的量化专家们认为:价格的变化长期来看是正态分布的,价格的波动性应该有一个长期的稳定平均值,取决于各种新信息到来的速度和市场对这些信息的反应。有时候因为突发事件市场会乱了方寸,波动性大增,像我们前面说过的过激反应,这时候就有了统计套利的机会——因为市场迟早是有效的,那些过激反应的“傻瓜”(有一次舒尔斯和美林银行几个销售人员共同去一个投资公司,舒尔斯兴致勃勃地讲述他们的套利策略,美林的一个年轻销售人员突然插嘴说美国政府债券市场不可能有这样的机会,舒尔斯很扫兴,他很生气地指着这个人说:“你就是我们的机会!正是因为市场上都是你这样的傻瓜我们才能赚钱!”。这令客户大为吃惊。)早晚会意识到自己的错误,波动性会降下来,降到长期平均水平,所以在教授看来,市场波动性过高的时候就应该通过出售期权来做空波动性,等待波动性的回落。“做空波动性”可能听上去有些别扭,波动性又不是一种金融工具,怎样做空呢?我们前面说过,在一定的条件下,期权的价格和波动性价格一一对应,所以做空期权就相当于做空波动性。后来这个市场进一步发展,有很多直接交易波动性的金融工具,比如波动性的期货、掉期合同等。有时候金融专家可能说:“波动性也是一种资产”,就是这个概念,因为波动性可以买卖。
对于长期资本管理的教授来说,市场上的这些“傻瓜”在不久的将来会忘掉上一次的错误,再次过激,再次给聪明人提供机会。
1998年年初,亚洲金融危机仍然在持续,一些股票期权的价格上涨,根据教授的公式可以算出市场预测未来的波动性将会是20%以上,长期资本管理认为这属于过激反应,于是开始出售波动性。直接出售波动性的另类金融合同现在很常见,当年并不太常见。长期资本管理就出售各种期权,包括标准普尔500的期权合同和欧洲各家股市的股指期权合同。但是,在他们做空期权之后,期权合同的价格不仅不跌,反而继续上涨。也就是说,市场预测未来的波动性将继续保持高位,甚至更高。这时候,长期资本管理的量化模型和决策人都认为这是更好的机会,所以他们接着卖各类期权。有一家银行当年曾经把长期资本管理戏称为“波动性的中央银行”,意思是说,别人都不卖都想买波动性的时候,只有长期资本管理还在不停地通过出售各类期权合同卖波动性。我们说过,期权实际上和保险很相似,长期资本管理实际上出售的是股市大涨或者大跌的保险合同——如果股市大涨或者大跌的话,长期资本管理就有可能被别人索赔。如果市场安静下来,长期资本管理就坐收期权金。另外,和保险合同一样,长期资本管理的收益是有限的,最多就是所收到的期权金,但是潜在的损失是无限的,因为股市的变化可能非常大。正是因为这个原因,大家都愿意购买期权而不愿意出售期权,愿意购买保险而不愿意为别人提供保险。
各国期货交易所里面都有各种期权在交易,但是这类期权合同的期限一般不超过一年,而且流动性有限,如果长期资本管理要出售大笔或者长期的期权合同就只能在柜面市场上完成。柜面市场也叫场外交易,意思是一对一的双方交易形式,而不是股票交易所中多对多的交易形式,这种市场的流动性有时候可能要比股票交易所好一些,而且你可以买卖各种量体裁衣的产品,不像交易所里面只有标准化的产品。但是柜面市场的透明性要比交易所差(巴菲特2008年也出售了很多股票指数的卖出期权,期限在15年。他认为布莱克——舒尔斯公式有误,这类期权的价格高过合理价格。但是跟长期资本管理不同,巴菲特只是出售股市下跌的保险,所以他的交易有很大的方向性,他的观点是股市长期来看是上升的。),而且它的流动性的变化可能很快,好的时候很好,不好的时候很糟。投资人在柜面市场交易时的交易对手一般是银行,所以长期资本管理就给各家银行出售各类期权。在它卖了期权之后,股市的波动性不仅不下跌,反而进一步上涨,所以长期资本管理的做空交易开始赔钱,对手银行要求长期资本管理不断增加现金抵押,长期资本管理要四处寻找现金来支付这些抵押,由于它的杠杆非常高,所以这部分现金抵押的要求数额也是非常大的。这是长期资本管理倒台的一个原因,虽说从长期来看教授们的观点也许正确,但是谁能挨过短期的资金短缺之痛呢?凯恩斯的那句话我们前面已经提过了:“市场的不理性的时间可能要比你保持不破产的时间长。”凯恩斯还说过:“长期?长期我们大家都死了。”
教授们的问题主要是出在正态分布的假设上面。
金融价格从来都不是正态分布,金融价格的分布有着典型的“肥尾”现象:按照正态分布来看几乎不可能的、远远离开平均值的价格变化所出现的概率要比理论值大出很多倍!也就是说,我们前面说的正态分布的钟形曲线的两个尾巴都要“肥”出很多。如果人的身高的分布跟金融价格的分布类似的话,你走在路上有可能常常遇到姚明或者比姚明高许多的人。最近几年人们提到的“黑天鹅理论”说的是同样的现象,意思是虽说大部分的天鹅是白色的,但是你遇到黑天鹅的概率要比你预测的高很多,或者你可能根本就不会知道会有黑色的天鹅,黑天鹅一旦出现,后果有可能是超乎想象的严重。黑天鹅的提法是一个很出名的交易员塔勒布在《黑天鹅》一书中提出的,书中所提到的很多现象其实都是金融里面的肥尾,但是不仅仅局限于金融:第一次世界大战、互联网的出现、“9·11”事件、个人电脑的出现等都是塔勒布说成的黑天鹅现象。一个常常被人提到的黑天鹅的例子是“黑色星期一”,1987年10月19日,全球股市大崩盘,道琼斯美国股票指数一日之内狂泻23%,有人计算,按照正态分布和过去若干年的平均波动性,如果美国股市从宇宙存在的那一天开始天天开门交易,这样的跌法出现的概率仍然是微不足道的。如果我们的宇宙能够重复存在10亿次的话,这样跌法的可能性不再是微不足道,但是仍然可以忽略不计。不过,“黑色星期一”这种在布莱克-舒尔斯-默顿理论所做的假设下完全不可能发生的奇迹,还是发生了,而且相当经常地发生,其他各种金融价格大幅变动的现象虽然没有“黑色星期一”那种一泻千里的气势,但是按照正态分布的假设,这些现象也同样属于不太可能出现的范畴。
当理论和实际有矛盾的时候,通常是实际获胜。我们回过头来去看布莱克-舒尔斯-默顿理论所需要的假设,我们知道:金融价格不是正态的,它常常有肥尾;金融价格的变化也不连续,常常大幅跳动;金融价格的波动性在中、短期不一定会马上回到长期的平均值;金融价格在变化的时候上一步和下一步也不一定毫无关系:如果毫无关系,价格变化就是随机漫步,反之,市场价格有趋势的时候就说明上一步和下一步有关系。为什么金融价格不是正态分布的?原因很复杂,其中重要的一点是影响金融价格的各种因素(包括各种交易人和投资人在内)在平常也许是各不相关的,所以价格变动好像是正态,但是在市场大幅波动的时候,人们惊慌失措,纷纷跟随别人行动,因此本来不相关的因素常常变得步调一致,正是我们平常所说的“墙倒众人推”。
布朗运动是因为水里的分子随机撞击花粉而产生的,但是水分子不会在大势不好的时候步调一致地往大门口冲。可是我们知道投资者会。
所以用正态分布和布朗运动来描述价格变化是有缺陷的。这种缺陷是量化投资行业所面对的最可怕的敌人之一。
澡盆大的游泳池
长期资本管理的另外一个投资策略是利率掉期套利。
利率掉期合同是交易量巨大的一种柜面交易产品,属于金融衍生工具的一种,有很多种变化组合,最简单的一种是固定利率调浮动利率的掉期。这种掉期合同设有一个面额,合同的甲方定期按照某个浮动的利率(比如LIBOR)支付给乙方利息,乙方则按照合同签订的时候双方同意的固定利率(这叫掉期利率)定期支付给甲方利息,所以我们大致估计,固定利率大概就是将来一段时间浮动利率的平均值。但是将来的浮动利率事先无法知道,所以固定利率是市场对它做出的预测。最先使用掉期合同的是发行了债券的大公司,这些公司发行的债券一般是固定利率的,因为债券传统上是支付固定利息的。但是,公司的未来盈利却是变化的,通常经济好的时候公司的利润高,但是通常经济好的时候社会利率水平也比较高,所以公司更愿意支付浮动利率。于是,利率掉期这种产品被银行开发、包装、销售和交易,专门为了帮助公司来管理风险。你也可以设想,你的房屋按揭贷款如果目前是浮动利率的话,你可以通过这种利率掉期合同把它变成固定利率,这样你就知道将来每个月的月供是多少。掉期虽说是银行为了公司发明的,但是现在除了公司之外,使用这种产品更多的是各类投资人和银行,银行之间的交易占了掉期交易相当大的份额。利率掉期合同的期限一般比较长,可以是10年、20年或者更长,通常交易面额也比较大,所以个人想要交易这种产品并不容易。利率掉期合同通常是银行按照顾客的要求量体裁衣的产品,每个利率掉期合同可以看成是许多其他的比较简单的产品的打包。银行在交易了各种利率掉期合同之后就需要通过使用各种量化模型,把一个个包装好的利率掉期合同拆开,分成各种简单产品,然后再分门别类地管理。除了利率掉期合同之外,掉期期权合同也很流行,掉期期权可以理解成掉期合同外加防止赔钱的保险合同,这类产品的标价、交易、分拆、管理自然离不了布莱克-舒尔斯-默顿的量化方法。跟债券一样,掉期也是个数学性、逻辑性很强的产品,换句话说,量化方法在这里如鱼得水。
掉期合同的固定利率和同样期限的政府债券利率相比一般要稍微高一些,这叫掉期利差。长期资本管理的狮子般的眼睛盯上了这个利差。这个利差反映的是互相交易掉期合同的大银行的信用级别和政府信用级别的差别:政府的信用通常要比大银行的信用稍微高一些,但也高不了多少,所以掉期利差通常都比较小,不过是二三十个基点(一个基点是百分之一个百分点,0.01%。)。可是有时候市场比较紧张,这时候掉期利差就会高一些,这又是一种过激反应,长期资本管理就等着市场上的傻子们犯傻呢:掉期利差高的时候长期资本管理就会杀入市场,购买收入固定利率同时支付浮动利率的掉期合同。利差高,就意味着掉期合同的固定利率相对较高。等到利差回落,长期资本管理再把合同卖出去,坐收利润(其实真正的套利操作要稍微复杂一些,因为在第一步购买收入固定利率同时支付浮动利率的合同之后,投资头寸的盈亏将会受到未来利率水平的影响:如果未来利率升高,浮动利率跟着增加,但是固定利率不变,你会赔钱,所以在第一步同时还要对冲掉利率水平的风险,不过这并不难。)。值得一提的是长期资本管理并不是把原来的合同卖出去,而是重新签订一份新的合同,新的合同是支付固定利率同时收入浮动利率的掉期合同,其他的条件和旧的合同完全一样。旧的合同是收固定、付浮动,新的合同是付固定、收浮动,这样浮动利率的部分互相抵消,固定利率的支付差额就是长期资本管理的利润。这种签订新合同而不是出售旧合同的做法在投资行业很普遍,为什么要这样做我们留到下一章再说。本来一笔买卖,一进一出,买卖结束,但是长期资本管理要和两家银行同时保留合同,正是因为这个原因,长期资本管理的衍生工具越来越多,1995年,面额为6500亿美元,到了1997年,面额达到12500亿美元,这是一个天文数字。
利率掉期利差套利的策略就是假定掉期利差有一个长期稳定的平均值,如果市场利差过高,那么自动卖出利差,等待利差回落以后获利。利率掉期利差套利的策略被很多人使用,长期来看没有什么错误,长期资本管理过去使用这个策略赚过很多钱,一些银行也开始效仿,但是教授们低估了另外一种风险,那就是流动性风险。1998年年初,掉期利差再次上升。长期资本管理照旧操作,购买收入固定利率支付浮动利率的掉期合同。很多银行那时候也都有了类似的套利操作小组,它们也采取相似的做法。但是这一次,利差不仅没有下跌,反而进一步攀升。一些和长期资本管理交易的大银行发现苗头不对,开始减少掉期交易的数额,梅里韦瑟的老主家所罗门兄弟突然扬言要退出利率套利交易,这更使许多银行慌慌张张,它们开始在市场上反转它们过去的交易(过去卖了,现在买回来),这使利差进一步高攀。更加要命的是,市场的流动性转眼之间就不见了,买入价和卖出价之间的价差陡然上升,高到常常是有价无市,要想做一笔掉期买卖就要付出很高的交易成本。长期资本管理这个巨人,怀揣着12500亿美元的合同,站在10米跳台上,突然发现脚下的游泳池变得只有洗澡盆那样大,如果它要是强行跳下去,后果我们都可以想象。流动性风险是教授的模型里面所没有考虑的因素(流动性风险也是这次金融危机中的最重要的风险之一,很多和信用风险挂钩的衍生工具的流动性转眼消失,持货的银行发现手里有一堆无法交易的产品。)。
长期资本管理手中持有大量的掉期合同,它们的窟窿越堵越大。
完美风暴
爱捡便宜的巴菲特
洗澡水里面的孩子
第3章我心里埋藏着小秘密
在对冲基金行业和投资银行领域,很多人膜拜西蒙斯就像膜拜神,冠以绰号“埃尔维斯”,意思是对冲基金之王。西蒙斯说他的投资方式是粗放型农耕,与巴菲特的密集型农耕不同,但是粗放农耕的结果确实令人称奇。
狼来了
追赶邻居
杀,还是被杀
复兴技术和谷歌公司
鸡蛋和“熵"
在寻找西蒙斯交易秘密的时候,我们偶尔发现了一个在谷歌公司工作的叫吴军的研究员,他写了一篇介绍最大熵模型的文章。无独有偶,川妹子在网上找到的那个被几家公司追着签约的张姑娘最后也到了谷歌工作,是吴军的同事。
吴军把投资里面经常提到的一句话“不要把所有的鸡蛋放在同一个篮子里”和这个数学里面的最大熵原理画了等号。吴军是一个语言识别(包括但是不限于语音识别)专家,自然他想的是如何把这个原理应用到语言识别问题上。在语言识别过程中,有很多各种各样但是又不是非常准确的信息,包括上下文、谈话的主题、说话人的习惯,环境里面又有很多噪声。如何将这些信息统统利用起来,对说话人所要说或者写的下一个词或者句子进行预测是一门很大的学问,最大熵原理就是这样一个综合信息的工具。拿鸡蛋和篮子的问题来说吧,事先我们不知道哪个篮子里面可能有鸡蛋孵化器,哪个篮子可能被石头击中,所以我们不会把所有的鸡蛋放在同一个篮子里,而是每个篮子里面都放一些。这样做,错误预测哪个篮子里面的鸡蛋能变成小鸡的风险最小。但是,如果我们对其中的一些篮子的情况知道略多些的话,我们就可以对篮子里面的鸡蛋分布略做调整,我们认为比较好的篮子里面可以多放两个蛋,比较可疑的篮子里面少放两个。总之,我们知道的信息,我们利用;我们目前不知道的信息,我们假定一切皆有可能,这就是最大熵原理。这个听上去很简单的信息学原理,表述成数学模型之后在书本上看也很漂亮,而且一位匈牙利的数学家还证明:这个模型的答案不仅是存在的而且是唯一的。更重要的一点是,这个答案的数学形式也很简单。不过,我们不得不加一句,简单也是相对的,数学家觉得简单的事情我们看上去不一定简单,所以我们在这里不再细究,那个有很多符号和指数函数的公式我们也不抄在这里了。
还记得我们在上一章说过的看上去很漂亮的公式可能会有什么问题吗?很漂亮的公式常常和现实生活不配套,因为现实生活是不漂亮的。漂亮的最大熵模型是不是也有同样的问题呢,形式漂亮,但是曲高和寡?跟很多描述金融现象的数学模型相比较,最大熵模型有一个优点,那就是它可以任意增加复杂程度。如果模型的某个方面跟现实有差异,那么你就可以给模型多加几个沟回,使模型与现实更加贴近。换句话说,你可以通过增加模型的复杂程度,把现实生活中各种不漂亮的东西包括到模型里面来。这样做的代价是什么呢?你必须完成复杂的计算:要训练模型、要迭代(一步一步地反复运算)、要收敛(多步反复运算之后的结果趋于一个稳定值)等,都是那些使常人头痛、数学家要干的事情。谷歌公司的吴军在这个领域的研究中有一些突破,他写道:“即使在我找到了快速训练算法以后,为了训练一个包含上下文信息、主题信息和语法信息的文法模型,我并行使用了20台当时最快的SUN工作站,仍然计算了3个月。由此可见最大熵模型复杂的一面。最大熵模型快速算法的实现很复杂,到今天为止,世界上能有效实现这些算法的人也不到100人。”吴军还邀请有兴趣实现最大熵模型的读者去阅读他的论文,我们虽然有兴趣,但是想想自己的脑袋和20台当时最快的工作站的差距,最后决定还是不试为妙。
吴军在他的文章里面提到的两位对最大熵计算做出突出贡献的人,就是我们前面曾经说起过的德拉·皮耶特拉兄弟。吴军说他们很有天分,并说由两兄弟改进之后的算法当时也只有IBM的试验室里面才有条件运算。当然了,现在的电脑计算能力跟十几年前相比已经是突飞猛进,吴军介绍说谷歌的很多产品中,比如机器翻译,都直接或间接地用到了最大熵模型。吴军有些惋惜地说:“他们两人(德拉·皮耶特拉兄弟)和很多IBM语音识别实验室的同事一同到了一家当时还不算大,但现在已是世界上最成功的对冲基金公司复兴技术公司。决定股票价格涨落的因素可能有几十甚至上百种,而最大熵算法恰恰能找到一个同时满足成千上万种不同条件的模型。德拉·皮耶特拉兄弟等科学家在那里,用最大熵模型和其他一些先进的数学工具对股票进行预测,获得了巨大的成功。”
其实很多人都问过西蒙斯为什么要搜罗世界上最优秀的语音识别专家来从事金融研究,西蒙斯说:“投资和语音识别其实很相似,都是要预测下一点发生的事情。”也就是说,通过对目前已知的各种信息进行分析,去伪存真,然后判断下一点最可能会发生的事情。
德拉·皮耶特拉兄弟精通的最大熵原理和前面提过的伯乐坎普的研究有很多共通的地方,我们后面还会回过头仔细看。吴军在他的文章中说:“信息处理的很多数学手段,包括隐含马尔可夫模型、小波变换、贝叶斯网络等,在华尔街大都有直接的应用。”这些听上去很吓人的术语我们也回过头来解释。
走向壮大,拒绝窥视
西蒙斯拿自己和巴菲特比较
走进长岛的复兴技术公司
机器和人
大奖章基金当然是量化到牙齿的基金。在量化基金的运作中,电脑模型收集大量的历史数据,然后从这些数据中寻找规律,这些规律一般用数学公式来表述,叫模型。如果认为过去的规律不是偶然的,将来还会再次出现,量化基金就会按照公式指示的交易方向来交易。各种电脑模型发出交易的信号或者指令,指令要么由基金公司的交易员来手工执行,要么通过电子方式直接执行。现在的量化基金大部分都使用完全自动的交易过程,交易员只是在模型或者市场出现异常的情况下才介入。复兴技术公司大概雇有20多个交易人员,他们的任务是以最低的成本来完成交易,并且尽量不被市场察觉。降低交易成本、避免市场察觉对量化基金来说是成败的关键,因为量化基金所要抓住的是很小的市场机会,交易成本稍微多一点点就可能意味着模型从盈利变成亏损。
人的判断在量化基金的交易过程中不是一个决定的因素。西蒙斯说:“我们一般不和我们的模型唱反调。”有时候市场的波动性超乎寻常,或者模型的信号减弱,这时交易人员才可能干预。
但这并不是说人完全是机器的奴隶。不管多么复杂的电脑模型,都是需要人去设计、编程、维护和控制的。连西蒙斯自己都说,没有一个长期不变能赚钱的模型,所以,模型必须要不断更新,这也完全是通过人来完成的。复兴技术的科学家整天都在寻找可能重复的规律,他们的研究对象是浩如烟海的金融数据。西蒙斯的公司在完成这项任务的时候用的是大批的数学家、统计学家、物理学家、语音识别专家,可以这样说,他们采取的寻找、比较、确定新的模型的方法在很大程度上借鉴了自然科学、工程科学的方法。换句话说,更多情况下,用实验来测试,让数字去说话。
他的投资模型所用的数学有多么高深,他的研究人员所需要的数学水平有多好呢?西蒙斯介绍说:“数学和其他科学其实很不同。数学要靠直觉,但是直觉对于凭借试验来论证的其他自然科学来说并不是最关键的。在其他自然科学中,虽说直觉仍然重要,但是猜测和假设更加重要,设计合理的试验(来验证或者推倒猜测和假设)也是重要的。跟纯数学相比,其他自然科学可能涉及的面更加广,但不是那么深。在复兴技术,我们用的数学工具也挺复杂的,但是高深就谈不上了,不过我们用的统计学技巧就可能非常复杂。我所需要的研究人员的确要懂得一定的数学,这样他能很熟练地使用我们所用的各种研究工具,但是更重要的是他应该对事情的根源很好奇,富有想象力,而且有恒心去揭示这些根源。”这段话是很值得那些立志在量化投资研究领域钻研的人深思的。
除了外围的辅助人员,复兴技术公司的员工分为三类:计算机和电脑系统专家、研究人员和交易人员。西蒙斯和研究人员每周开一次会,讨论最新的研究投资模型的项目。员工每半年拿一次现金奖金,奖金的多少当然和大奖章基金的表现相关。从董事总经理到清洁工,每个人都会参与分成,决定每个人奖金相对多少最主要的考虑因素是每个人对公司长期发展的贡献。西蒙斯很强调“长期发展”,他说公司的很多研究项目都要好几年才能完成,如果只是按照一年的表现来发放奖金对公司没有好处。华尔街的金融机构在这次的金融危机中受到重创,很多人都认为按照短期表现发放奖金的制度是元凶之一。西蒙斯通过奖金分发机制想达到的目的是“每个人都希望其他人的报酬也很好。”这个出发点和其他大多数金融机构不同,因为通常其他金融机构在发奖金的时候,每个人都希望其他人的报酬差一些。很多在投资银行工作过的人都不会忘记发奖金时候的你死我活,人性的丑陋在金钱的驱动之下暴露无遗。
复兴技术公司为自己制定的每半年的回报目标为12%,许多其他的对冲基金公司全年能达到12%的回报就谢天谢地了,而复兴技术在过去则是年年轻松超越内定的目标。许多员工都持有复兴技术公司的股份,当然他们在大奖章基金里面也有投资,所以他们的收入既包括大奖章的投资回报,也包括公司的工资、奖金和分红,后者的来源主要是复兴技术从大奖章基金收取的管理费和表现费。我们说过了,大奖章的高回报和高收费其实都是羊毛出在羊身上。每年西蒙斯都自己出钱邀请公司员工外出旅游一次,去的是像百慕大群岛、牙买加这样的豪华度假地。
虽说西蒙斯从来不谈钱的事情,但是众所周知,他自己赚的钱可以算是车载斗量。根据复兴技术给美国证交会上报的材料,复兴技术的1/4~1/2的股份在西蒙斯手里,他的一个儿子持有不到5%的股份。科技主管劳尔持有10%~25%。语音识别专家、执行副总裁布朗和爱玩火车模型的默瑟各占5%~10%。财务总监马克·西尔伯也有5%~10%。交易总管保尔·布罗德持有份额小于5%。其他的股份分别在雇员手中,大概有将近100名员工有公司的股份。也许这些人所持股份的数额不大,但是乘上一个大数,雇员每年的分红也是相当可观的。别忘了,西蒙斯的基金收费奇高,收来的钱,除了成本(其中包括雇员的工资和奖金),剩下的就是股东回报。
要想加入这个超级富豪的生产线,你可以不懂任何金融和投资,但是你不能不懂科学,每个新的员工候选人必须要在全公司员工面前讲解他的科学研究成果,这通常是和金融毫无关系的课题。大部分在金融界工作过的人都以曾经在华尔街工作过的经历作为他们找工作的卖点,但是这种背景在复兴技术却是个人履历上的一个污点。很多科学家到了复兴技术之后仍然从事跟他们过去的研究类似的工作,过去他们也许研究的是人的语音,或者基因,或者流动的液体,现在研究的数据是股票价格,所用的工具没有什么不同,工作单位的氛围也和大学或者科研机构相似。他们能看到自己的工资、奖金和投资的价值在飞速增长,但是很多人对金融仍然是一无所知。
对西蒙斯来说,这不是坏事。
和其他金融机构不同,除了退休或者寻找其他的刺激之外,员工从复兴技术跳槽的极少,这一点西蒙斯引以为豪。这当然也和公司多年的超常表现有关系,应该说这是一种相互积极推动的共生关系吧。
原子对撞
秘密和猜测
英格兰德和斯皮策
反诉讼
投资其他基金
新的基金
量化基金遭到血洗
什么是“基本系统”?什么是“我们的市场预测系统”呢?我们这里也先卖一个小关子,留到第5章再说。
复兴机构投资人股票基金的亏损当然不是唯一的,很多量化基金都有巨大亏损。有人在问:“这是不是黑箱投资的终结呢?”一个在基金评级公司里面专门负责对冲基金的专家在接受路透社采访的时候回答:“现在看还为时过早。我觉得只是短暂的倒退,对规模比较大的基金不会有什么很大的影响。”
2007年10月,西蒙斯又发行了一个新的基金,叫复兴机构投资人期货基金,专门投资各种期货。这次,西蒙斯说最大容量为500亿美元。
看上去复兴技术近10年在不断摸索新的投资方式、技术,从创投基金到对冲基金的基金,从低频率交易到面向机构的新基金,但是西蒙斯很清楚公司的立命之本是什么。他说:“我认为,如果我们偏离了公司的数学模型,那将不会对我们有任何好处的。”
在结束本章之前,我们来重温一下已经提到的关于大奖章的秘密吧:
- 交易策略以短线操作为主。
- 使用“每笔交易数据库”(记录每一笔交易的价格变化,而不是每分钟的价格变化);很可能使用限价指令表之类别人比较少用的数据进行分析。
- 模型用的不是很高深的数学,但是用很复杂的统计学工具。·使用语音识别的分析方法来分析数据,很可能是统计信息论(伯乐坎普是专家)、最大熵(德拉·皮耶特拉兄弟是专家)及隐含马尔可夫模型(帕特森是专家)。
- 使用不止一个交易模型获取信号;交易模型不断变化。·在交易不同的金融工具和不同的基金中可能使用不同的交易模型(大奖章使用短线交易模型,机构投资人股票基金使用中线交易模型)。
- 不用华尔街的专家,雇用研究人员看重科学和电脑背景。
- 电脑和其他交易技术的运用对公司的成功是非常关键的,这家投资公司的名字里面有“技术”两个字就是线索。
- 对交易工具的流动性问题的考虑占很重要的位置。
- 借鉴别人的好方法,获取行业信息,但是对外实行信息封锁。
- 不断探索新的投资方式、工具。
大奖章的秘密虽说我们已经看到了不少,但是好像还不够具体。不过,这里我们又要和西蒙斯、大奖章短暂告别,因为我们先要补补课,看看量化投资的历史和各种方法,等到我们武装好了之后我们再对西蒙斯的秘密做最后的冲刺。
第4章 股价上的风景
有效市场假说讲述的宏观现象掩盖了金融交易在显微镜下如同海底涌动的潮水。逆有效市场假说而行的量化投资,如同海里的头号猎手鲨鱼,冷面观测、判断潮起潮落的规律,捕捉在潮水里的猎物。西蒙斯就是这样一只潜伏在波浪里伺机而动的鲨鱼。
不用数学讲量化
狭义和广义的量化投资定义
量化投资的复杂程度
马科维茨
西门没有察觉到川妹子表情的变化,继续在讲:“我就简单说说量化投资的历史吧,然后我再介绍为什么它能存在、发展、壮大,为什么它能赚钱。量化投资的历史要看你是用上面的哪一种定义,如果是狭义的量化投资的定义,连续时间的量化投资,它的历史应该是从1973年布莱克-舒尔斯-默顿的模型算起,但是也有很多人把它的起点回溯到1900年一个不得志的法国数学天才巴士利埃。有人把自1900年起包括窄、中、宽各种量化投资定义最重要的的文献归纳了一下,发现其中3/4都是有关连续时间的量化研究,简单来说,都是期权标价模型的研究和应用。这3/4的重要文献的作者中除了布莱克、舒尔斯和默顿,还有几个大师级的人物,不过我们今天就不提了,因为这和我们所关注的西蒙斯式的量化投资不是一个方向,以后有机会我再跟你单独解释,那才是我的本行。“
如果我们用广义的量化投资定义来看量化投资的历史,其实美国30年代就开始有很多学者和投资人使用各种数学、统计学的工具来分析投资,但是划时代的一个人物应该说是哈里·马科维茨。他1952年在权威杂志《金融研究》上发表了一篇论文,题目叫《挑选投资组合》。那时候马科维茨才刚刚25岁,很多人都认为现代量化投资理论的第一个突破就是马科维茨的这篇文章。在这篇文章里面,马科维茨通过使用数学、运筹学和统计学的工具,将多元化投资对投资风险的影响进行了量化研究。在他的这篇文章之前,对投资风险的研究一般都局限在单一股票上,但是马科维茨的量化方法可以将貌似无关的各种股票、债券通过漂亮的数学工具联系起来,变成投资组合,再经过数学运算,得出很干净的结论,画出很平滑、很漂亮的曲线。从那以后,金融和投资的研究和实践就一发而不可收地变成了一个量化方法的天堂,《金融研究》杂志越来越像一本数学杂志,布莱克-舒尔斯-默顿的理论则使量化技术在金融投资中的应用更上一层楼。”
西门接着讲:“马科维茨随后将这篇文章的思路加以扩充,写成了博士论文,3年以后取得了芝加哥大学的博士学位。他论文答辩的时候前面坐着经济学巨星米尔顿·弗里德曼,因为马科维茨的论文使用了很多当时经济学之外的数学、统计学工具,大师沉吟道,‘嗯,论文好是好,可惜不是经济学的论文。’马科维茨几年之后又将他的博士论文扩展成一本书,这本书到现在还被认为是现代金融学最经典的作品之一,马科维茨也于1990年获得了诺贝尔经济学奖。弗里德曼说马科维茨的论文不是经济学的论文也不是没有理由,其实马科维茨在运筹学和计算机编程语言方面也有突出的贡献,曾经得到过这两个领域的最高成就奖项,所以他当年的论文中满是各种数学公式、最优化算法,难怪被人误认为是其他领域的论文。从他以后,经济、金融、投资的研究都走上了量化的道路,数学、统计学打进了金融的城门。“
我读到过一个关于马科维茨投资的故事,是说当年他工作的时候要为他自己的退休金如何进行投资拿主意。如果他按照自己的理论行事,他就应该去找来历史数据,计算一下各种资产的方差和协方差,然后计算出最合理的投资组合:多大比重投在股票,多大比重投在债券,等等。但是,马科维茨没有那样做。他说,‘我当时在想,如果通过计算得出的投资组合里面股票太多,之后股市大跌,或者,组合里面股票太少,但是股市暴涨,你想我该有多后悔啊?所以,我索性把钱一半投进了股票,另外一半投进了债券。’换句话说,连超级高手也没有使用他自己划时代的获得诺贝尔奖的理论!他用的是什么理论呢?是咱们的老祖先孔夫子的中庸理论。这其实是挺有意思的一个话题,我有时候在想,也许像西蒙斯这样的人正是意识到了金融理论里面关于投资人的各种‘理性’行为的假设问题百出,他们才能从中渔利。嗯,我要仔细想想这个问题。”
川妹子发现西门开始自言自语了,赶紧提醒他别走神。
蝴蝶效应(努瓦·曼德勃罗特)
西门呷了口茶,继续说:“我们前面关于量化投资一个窄的、一个宽的定义就说了半天历史,我们还是说回跟西蒙斯投资方法更加相关的那个定义吧:使用规则来进行投资的量化方式。这种方法其实也有很长的历史了,至少可以推回到20世纪30年代的美国,甚至更早。谁是鼻祖也没有定论,但是有几个人物还是挺重要的,我们可以分头简单说说这几个人,这样也能对这种投资方法的历史渊源有些感性的认识。
“首先要提到的一位叫伯努瓦·曼德勃罗特,数学家,出生在波兰,拿美国和法国护照。 他是耶鲁大学教授,IBM实验室的研究员。他开创了一门全新的研究领域,叫分型几何,属于混沌理论的开拓和延伸。解释混沌理论的最好例子就是蝴蝶效应——山这边的一只蝴蝶扑闪了一下翅膀,山那边的龙卷风就改变了方向。这用来说明混沌的东西是多么的不稳定,一个很小的变动就可能在系统里引起连锁反应,改变后面的一切。金融体系也是很不稳定的,所以用混沌理论来解释也是顺理成章的事情。很多人认为美国的次贷就是这样一只引发了全球金融危机的蝴蝶,当然,次贷不是一只很小的蝴蝶就是了。如果我们要细究混沌理论的鼻祖,那我们又要退回到我们刚刚提过的庞卡莱,这个人在很多领域都有辉煌建树,不过这是那个时代比较常见的现象——一个天才能在很多领域开拓、留名,可惜,这个时代早就过去了,现在,能在一个很狭窄的领域成为专家就已经是一件很不容易的事情了,我们常常开玩笑说,博士论文的课题是某种苍蝇腿上汗毛的粗细。正是因为这样,能在两个领域独领风骚的西蒙斯能够一下子抓住大家的吸引力。
“有不少书籍都是专门讲混沌理论在金融投资中的运用的,很多大学金融系也有专门的课程,不过我们今天要是专门谈这个理论的话就有些离题太远了,所以我们还是只说说曼德勃罗特吧。他首创的分型几何学作为一种研究的工具被用到许多自然科学和社会科学的领域,比如一池清水里面丢下一块石头之后的波动,比如各种植物的外观结构,比如宇宙里面各种星星的分布,我还见过用这个理论去研究中国古代家具构造的书呢!曼德勃罗特1982年写过一本叫《自然界的分型几何》的书,其中将山的形状、海岸线的形状、河床的形状、布朗运动、植物的结构、血管的结构、肺的构造、星系的构造、音乐、绘画、建筑物和金融市场的价格变化等都通过分型几何来研究,揭示出其中相通的地方。这本书的影响很广。这些自然界的东西,虽然没有我们中学课本里面学的平面几何或者立体几何图形的规整和光滑,但是对于曼德勃罗特来说,它们才更值得研究。用行话来说,传统几何学的维数是整数:比如一条直线,一维;一个平面,两维;一个空间,三维;空间加上时间就是我们平常说的四维。四维以上的空间是西蒙斯这样的人去的地方。分型几何则允许分数的维数,比如1.5维的空间,既不是直线,因为要比直线自由,也不是平面,因为不能随便去平面的任何一个地方。用分数维数(这就是为什么叫‘分型’几何)的理论,曼德勃罗特得出不少令人惊讶的结论。比如他曾经发表过一篇论文,说英国的海岸线是无穷长的,这使许多人大为不解:海岸线明明是有限的长度,就像你用一个皮尺去量一个皮球的周长一样,怎么可能是无限的呢?曼德勃罗特的论点是:海岸线是曲曲折折的,即便你用显微镜来看,仍然是曲曲折折的,所以它究竟有多长其实取决于测量仪器的精度,越精密的仪器,测出来的长度就越长。精度无限大,长度就无限大。其实仔细想想,金融学的价格的确和曲折的海岸线是很相似的,如果金融价格是连续变化的话那就更像了,所以,金融价格的变化也可以看成是分数维数的,连续时间金融理论的一个重要观点就是金融价格的变化总和是无穷大的,跟海岸线的长度一样,这跟我们平常想象的不一样,不过这是一个技术性比较强的话题,我们不去深究。
“曼德勃罗特在50年就提出,各种金融价格的分布不是正态的,而是有比较明显的肥尾,价格的变化也有可能出现蝴蝶效应:很小的改变可能会引发市场的巨幅波动。他用棉花期货的价格作例子,用分型几何的方法分析了价格的分布,证明了他的观点。他的研究表明:棉花的价格变动既有可以预测的一面,又有完全出人意料的一面。价格的变化不可以用正态分布来描述,但是可以用分型几何来很精确地描述。因为正态分布是漂亮的,又很容易计算,所以多数人都选择正态分布,而曼德勃罗特的关于肥尾的警告只有当黑天鹅游出来、金融体系岌岌可危的时候才被人想到:哦,人家曼德勃罗特早就说过迷信正态分布是不行的!”
“曼德勃罗特曾于1996年访问中国,参加李政道发起的主题为‘简单与复杂’的学术研讨会。当时他还对记者说:中国文字是象形文字,个个都是几何图形,而他也是几何学家,可惜他一个中国字也不认识,否则可以用分型几何的方法来研究一下中国的文字,因为他曾经用该理论研究过英语词汇中的字母分布规律。曼德勃罗特涉猎广泛,曾在概率论、通信工程、水利学、经济和金融、湍流、宇宙学和临界现象等各方面发表过各种论文。虽说他的分型几何分析很少被直接用到量化投资的最前沿,也就是说这个理论很少被用在对金融价格的预测上,但是他使用比较高深、复杂的数学工具来分析金融数据的做法应该说给了后续量化投资的研究很大的启迪。”
大花湖畔的怪杰(艾迪·塞柯塔)
杀机
卖地毯的唐奇安
走的人多了,捷径就不再是捷径
双移动平均
法玛和有效市场假说
朝三暮四
攻城的过程正是城墙缺陷消失的过程
肥尾的有效性
川妹子小结
后海里的鲨鱼
第5章 趋势是你的朋友和敌人
从量化交易的历史中寻找西蒙斯大奖章基金的秘密:通过统计信息分析判断外汇和债券短期的价格变化,加入风险控制模型与统计套利,高速交易大量股票;引入统计套利的变种,低速交易股票;继续引入其他模型,分析不太常用的数据来源——这就是大奖章。
美联储和投机商
千奇百怪的量化方法
通过这个作为前菜的小故事我想要说的是:量化投资的模型和研究手段太多了,涉及很多貌似不相干的领域。可以毫不夸张地说,基本上所有理工科能用到的工具都已经在投资模型上试过了。除了高等统计学里面所罗列的研究方法之外,在量化投资中扎下根的还包括许多常常被人提到的其他研究工具和方法,比如:模糊逻辑、神经网络、基因编程、隐含马尔可夫模型、小波变换、贝叶斯网络、分型几何、聚类分析,等等。既然这是一本讲量化技术的书,我们不妨在这里简单介绍一下,没有兴趣的读者尽可放心跳过这一节。
- 模糊逻辑——一种进行逻辑判断和运算的方法,假定各种概念不能完全用“是”或者“否”来代表,而可以是70%的“是”,30%的“否”,亦即我们通常说的似是而非;做逻辑判断的时候也不能简单地说如果“是”的情况下则如何如何,要么如果“否”的情况下则如何如何,因为“是”或者“否”本来都不是完全确定的。在模糊逻辑中,判断都是要通过一些特定的模糊运算来完成。可以看到,模糊逻辑的运算方法是针对现实生活中许多不能用泾渭分明的逻辑关系来表达的情况设计的,在量化投资分析中常常无法准确判断,所以存在同样的情况,使用模糊逻辑可能比较合适。
- 神经网络——前面提过,将很多小的模型组合起来,模拟人脑判断方式的运算方法,每一个小的模型都相当于一个神经元,可以单独简单思考,然后由一个“大脑”做出总判断。比如一个小模型只用双移动平均线法判断短期趋势,另外一个判断长期趋势,还有一个使用通道突破法,等等。每种模型分别判断,然后神经网络会把它们综合起来。这种方法也可以和模糊逻辑联合使用。
- 遗传编程——前面也提过。模仿生物进化中基因突变和重组的过程,让很多模型自由突变、组合,通过现实数据来寻找最能适应环境的模型组合。
- 隐含马尔可夫模型——马尔可夫模型指某种价格或者系统从上一个状态跳到下一状态的随机过程,下一步和上一步之间没有什么直接的关系,也就是说,这个系统没有记忆。隐含的马尔可夫模型是指有些变量无法直接观测的情况,这个模型是在复兴技术创业时代参与过的里昂纳多·鲍姆首先提出来的,现在在很多领域都有应用。在金融中它可以被用来推测目前的市场状态究竟是趋势呢还是在区间徘徊,究竟是高波动性的状态还是低波动性的状态,等等。1993年加盟复兴技术的剑桥大学数学博士尼克·帕特森就是全球这项分析技术公认的专家。2000年他离开复兴技术,将这种分析技术用到人类基因的破译工作上。复兴技术使用这种模型的可能性非常大。
- 子波变换——信号处理的一种技术。通俗地说,就是制造出一些特定的波动,叫小波,然后让这些小波跟所要研究的对象互动,等到再把小波分离出来的时候,小波里面就有关于研究对象的一些信息了。制造不同的小波,就能探听出不同的信息,这种方法在很多行业都有应用。在处理金融数据的时候,用波的方法来分析应当算是一个比较独特的角度,因为波的长度、频率之类的概念是我们平常研究金融数据的时候不十分关注的东西。举个例子,小波可以是一笔小的交易,通过市场价格对此的响应,你可以推断出是不是有什么大的交易潜伏在什么价位。
- 贝叶斯网络——贝叶斯计算方法归功于18世纪的英国数学家贝叶斯神父,主要的意思是说各种概率只是目前的一个不完全的信念,而不是耶和华安排好的一成不变的东西(这当然不是贝叶斯神父的原话),人们应该按照最新出现的信息来更新各种概率。贝叶斯网络就是按照这个思路建立起来的一个网络,描述一系列不确定的数据和过程之间的可能存在的因果关系,并不断更新。
- 分型几何——前面提过了。分数维数的空间和混沌系统,蝴蝶扑闪出来的龙卷风。
- 聚类分析——一种统计工具,按照数据和一些事先制定的标准将各种不同的对象分成不同的组群,其实也就是我们通常说的个子大的人站后边,个子小的往前站的复杂版本。当然,用机器来完成的聚类分析不仅仅能在很短的时间内将大量的数据分门别类,而且能找到我们并不知道的类别。
这些分析方法也许听上去都很复杂,其实我们日常生活中接触到的许多东西都使用过这些方法:比如互联网的搜索、电网上电量的调整、天气预报、疾病的诊断、基因的筛选、药物的设计和测试、电子信号的压缩和传输、手机上的手写体输入和语音拨号,等等,所以它们被用在金融投资上面并不是那样奇怪。当然,我们猜这本书的读者更关心的是点钱点到手发软的西蒙斯所使用的量化模型,那么我们就接着说回西蒙斯吧。
有关他的交易模型的消息自然不可能在学术杂志上找到,但我们也不是一无所知。
你是否在撒谎
还记得1990年从埃克斯手中买走埃克斯有限公司股份的加州大学教授伯乐坎普吗?他当年成为埃克斯有限公司总裁,1年以后他以6倍的价钱把股份出售给了西蒙斯。他应该是给西蒙斯的交易模型打下最早的基础的人,但是他觉得跟搞金融的人打交道很闷,所以选择留在校园里面。
伯乐坎普在自己的简历上说:大奖章的交易模型所使用的分析数据的方法基本上都是源于他的统计信息理论。
统计信息理论应该说是一种从大量的噪音中寻找信号,最后做出结论的方法,跟我们前面提过的最大熵理论和隐含马尔可夫过程都有关系。理论的本身非常学术化,三言两语也说不清楚,但是伯乐坎普的研究是从一个大家熟悉的游戏开始的。我们平常所玩的“猜人名”的游戏是这样的:两个人,一个提问,一个回答是否。回答问题的人随便想一个古今中外的人名,提问的人来问问题,而回答人只说“是”或者“否”,看看在多少个问题之后提问的人能猜出回答人想好的那个名字。虽说大千世界的人物那么多,但是通常问问题的人都可以用十几个问题确定回答人想的是谁。伯乐坎普关注的问题要比我们这个游戏复杂一些,回答的人可能在回答问题的时候撒谎数次,所以猜的难度一下子增加了,因为你不知道回答的人说“是”的时候是在说真话还是在说谎。伯乐坎普的统计信息理论研究的是关于三个变量对提问的人能否猜出正确答案的影响。这三个变量是:第一,想名字的范围有多大,1万人?10万人?范围越大,越难猜;第二,问问题的人可以问几个问题,问题越多,越容易找到结果;第三,提问的人能撒几次谎,次数越多,越难猜。伯乐坎普的理论给出了这三个变量之间的关系。
我们不知道这个理论究竟是如何被伯乐坎普和西蒙斯用在价格规律的发现过程中的。一种可能性是研究过去一段时间(比如说1万天,相当于上面说的范围变量)的价格变化,每一次变化只有两种可能,上或者下,相当于“是”和“否”;我们可以把每天价格变化之前的各种价格走势当成是各种问题:比方有一天价格上涨了5%,之前价格连续三天上升,另有一天价格下跌了3%,当前这个月份第一个周四的上午价格先涨了2%之后又回落了1%,等等。我们把这些观察到的东西当成是各种不同的问题,而把随后那一天的价格变化当成是答案。前面的价格现象可以转化为这样的问答:
问:“如果前三天的价格连续上升,今天的价格会涨5%吗?”
答:“是。”
问:“如果本月第一个周四上午价格先涨了2%之后又回落1%,今天的价格会跌3%吗?”
答:“是。”
上面的两组问答可能是市场上存在的规律,也可能是巧合,问和答之间毫无关系;换句话说,答案可能是假的。我们不知道究竟有多少答案是真的,有多少是假的,所以我们无法从大把大把的巧合和偶然中找到真正的规律。使用伯乐坎普的统计信息理论可以去掉很多噪声,有效寻找到真正引起价格变化的那些条件。
语音识别也是同样的道理:需要从人们所发出的各种因人而异、似是而非的声音里面寻找信号,过滤掉各种噪声。复兴技术雇用了很多这方面的专家,这使我们推测,它的主要分析方法是跟统计信息论、隐含马尔可夫模型和最大熵相关的信息处理技术。这种技术的使用使复兴技术能够更有效地从过去的价格中去除大量噪声,发现规律。西蒙斯在复兴技术的左膀右臂布朗和默瑟都是这方面的专家。
重新审视西蒙斯的量化模型
接下来,我们来重温一下我们已经知道的关于西蒙斯的量化模型的信息,包括他已经不再使用的量化模型:
- 市场过激反应
- 套利交易
- 趋势和联动性
- 偏门信息源
- 买卖掉期合同
模型的新陈代谢
复制复兴技术
计算机博士肖尔
最年轻的亿万富翁格里芬
这本书里面提到的很多人都是亿万富翁,其中最年轻的应该是大本营投资集团的肯·格里芬,他生于1968年,是哈佛大学的经济学学士。在学校读书的时候他就开始买卖股票,因为他那时候买不起能够看价格的终端机,所以常常在课间休息的时候跑去券商的营业部看最新的价格。他22岁不到就开创了大本营集团,最开始的时候专门从事可转换债券套利的策略。现在该集团管理的资金额大约为130亿美元,比两年前的最高点200亿美元缩水不少,但是仍然是全球最大的对冲基金之一。他的基金同样交易频繁,通常要占美国、伦敦、中国香港和东京股市的交易额的3%左右。该集团大量采取量化投资策略,尤其是可转债套利策略和统计套利策略。可转债是将来可以转为股票的一种债券,它可以用布莱克-舒尔斯-默顿的方法分解成各种零件,可转债套利策略就是赚取整体和零部件之间的潜在价格差别的一种手段。大本营还是一些股票期权的做市商,直接跟华尔街银行叫板。
收藏家科恩
波士顿红袜和亨利
弗雷的个人履历
关于西蒙斯,除了我们前面说过的那几点之外,我们还能找到什么信息呢?联系采访肯定是做不到,即便能联系到的话我们前面也看到过西蒙斯是如何守口如瓶的。一个偶然的机会使我们发现了西蒙斯的左膀右臂之一弗雷的个人简历,这份简历在一定程度上印证了我们前面的猜测,所以我们就再回过头来说说弗雷这个人吧。
弗雷的上一辈人里面没有一个大学生,他自己则获得石溪大学应用数学和统计学的学士和博士学位,用中国人的说法,他应该算是家族的荣耀。但是他攻读学位整整花了12年的时间,因为这两个学位他都是通过业余时间来完成的。这期间,他曾经在国防分析研究院工作过,在那里认识了西蒙斯。在随后的10年中,他又给一连串的公司打过工。在他的简历里面他还列出了他和别人在纽约州开的一家餐馆,说这家餐馆赚的钱就是他读博士的奖学金来源。1987年他获得博士学位的时候已经是一家军事装备公司研究部门的小主管,下面管有25个人。那时他主管的一个项目是研究如何自动测试轰炸机复杂的电子设备是否有故障,这个项目的结果被用到美国最新式的海上轰炸机的设计上。
博士学位到手之后他加入了摩根士丹利的股票交易部门,设计开发当时很领先的量化投资系统。这个使用银行自营基金,依靠模型进行交易的小组是华尔街最早开始统计套利的部门之一,DE肖尔也在那里干过。
之后他和别人共同创建了开普勒金融管理有限公司,这家公司于1992年被复兴技术收购。随后的12年中他是复兴技术的董事总经理、执行委员会的成员和管理委员会的成员,全面负责复兴技术的研究和产品开发。所以要说谁最知道该公司最核心的秘密,除了西蒙斯之外,弗雷紧随其后。
2004年弗雷从复兴技术退休,成了石溪大学应用数学和统计系的量化金融学研究方向的首任学科主任。
弗雷是这样介绍复兴技术公司的:“复兴技术公司是一家量化投资管理公司,管理大约50亿美元的资产。公司的旗舰基金是大奖章基金,在过去的10年中平均每年回报超过30%。在我1992年加入的时候,大奖章的资产为1.1亿美元。复兴技术大约有250名员工,分别在纽约、长岛和加州伯克莱。”然后他一个个列出了他在复兴技术的成就,因为我们可以从中看出不少复兴技术的模型发展状况,所以下面我们逐条解释一遍弗雷12年间在复兴技术的成就:
- 组建利率研究部,并招聘人员。开发风险控制和利率标价方法,使用以预测性为主和以市场性为主的利率模型。他是复兴技术公司利率交易量化模型的总设计师。
市场性的利率标价方法一般是指通过使用布莱克-舒尔斯-默顿的基本方法(外加后续学者的新贡献),对收益率曲线建造模型,确定各个不同时间点的利率之间走势的关系,然后分析各种金融产品的价格。长期资本管理用的就是这个基本的交易模型,但长期资本管理采取的投资策略是判断各种产品的市场价格是不是和理论计算出来的价值相符,而复兴技术很可能是通过判断利率的短期走势(“预测性”的模型)来买卖相关产品。“风险控制”部分指的是总仓位的控制、多空的控制、各种部位相对大小和绝对大小的控制、各种止损措施,等等。
- 开发、实施、营销和管理了复兴技术使用新模型的一档基金:“量股策略”(Equimetrics)。这档基金使用长期投资策略,低风险,股市中性(股票做多和做空的数量大致相等,所以跟大市波动的相关性不大。)。复兴技术原有的投资人主要是“高净值客户”(也就是通常所说的富人),新的模型主要是针对机构投资者而开发的,它是复兴技术原有量化模型的变种,在营运的第一年募集到7亿美元投资。2002年,该基金被收编进了大奖章,此前的年回报率为18%。
我们知道量股策略是从1999年4月开始运行的,它从1500只流动性比较强的股票或者优先股中由模型挑选出大约1000只股票,可能是做空,也可能是做多,整个投资组合的剩余风险(多的仓位减去空的仓位)通过使用股票指数期货来对冲。任何单一股票的权重都不超过整个组合的5%。这个策略的交易速度不是很快,每年的换手率在13倍之间,杠杆也只有23倍。
量股策略应该算是股票多空策略的一种,但是交易的频率比通常的多空策略要稍微低一些,它是下面将要说到的统计套利策略的慢速版本。西蒙斯在谈起量股策略基金的时候说:“他们选股的模型也是在数据堆里面寻找重复性的规律,然后他们问自己:这些规律和市场运作、投资人的心理能不能挂上钩?如果能的话他们就按照新的规律改变选股的策略。”
在前一章引用的西蒙斯致投资者的信中他提到了“基本系统”,这个基本系统就应该是在量股策略的基础上演变出来的。西蒙斯通过模型的运算,挑出两组股票来,分别做多和做空,做多的部分是整个基金值的170%左右,做空的部分是70%,两者加起来,整个基金的股票净值接近100%。通过模型的仔细挑选,西蒙斯认为这个基本系统能够和标准普尔500指数的回报相当,也就是能够匹配大市的回报,但是因为有多有空的原因,基本系统的风险只有大市的2/3。这一点自然也是有悖于有效市场假说的:回报相当,但是风险只有2/3,这就是免费午餐。但是话又说回来,整个对冲基金的概念在某种程度上就是有悖于有效市场假说的:如果市场是有效的,谁也打不过市场,那么对冲基金的管理人凭什么打败市场呢?
- 开发了“超新星”(Nova)基金所使用的投资策略,该基金是一个交易积极、市场中性的美国股票基金,使用统计套利策略。在1995年2月之前组建、管理该交易小组,包括为交易小组招聘人员。在策略的试营运期间,回报超过40%。1997年该基金策略被收编进了大奖章基金。这个快速交易的统计套利策略和我们前面提过的其他3个超级量化基金的策略基本一样,所以我们不能不说说统计套利究竟是怎么回事儿。在本书的前面我们曾经提到过一次统计套利的概念,说任何通过统计方法多次交易之后预期能够获利的交易方式都算统计套利,我们也提过比较狭义的统计套利的定义,接近于股票多空交易,这里要专门说的是狭义的统计套利的操作。
按照罗闻全教授的定义,统计套利指的是根据股票具有快速波动之后回归本来价位的特性,从一个可能包括成百上千只股票的组合里面,使用量化模型方法,挑选合适股票,进行相关多空的交易方式。这种交易方式的持有期一般很短,可能只有几天,甚至几秒钟。采用统计套利操作的基金需要拥有相当强的计算、交易和科技实力。统计套利和多空操作有相似之处,多空操作一般看一对类似的股票,如果其中一只在一段时间表现超过另一只,那么表现差的一只在将来很可能会赶上表现好的一只,所以应该买入表现差的一只,沽空表现好的一只。统计套利把这个原则用到包含千百只股票的组合中去,通过给各种股票按照一定的原则打分来决定哪些做多,哪些做空,然后再使用马科维茨的理论来确定做多多少、做空多少,从而降低整个组合的风险。打分的原则多种多样,每个基金都不同,各个基金都视其为自己最绝密的绝密,但是一般可能包含超前或滞后的信号、技术分析里面比较大的阻力线或者支持线(比如说股票价格突破一个大的整数价位)、公司特有的兼并之类的消息以及短期趋势等。
统计套利操作需要复杂的计算,而且需要不断调整仓位,交易量很大,所以一般基金要能使用自动交易手段来减少人工带来的误差和延误,而且基金通常会采取各种其他措施来降低交易成本。正是因为这种策略的巨大交易量,所以投资银行刚开始都把使用这种策略的大基金视为财神。但是投资银行慢慢也发现这个财神有着阴暗的一面,因为财神开始直接和投资银行竞争,不过这是后面要说的话题。
2006年有一个叫布克斯达博的人写了一本叫《我们自己设计的魔鬼》的书,讲的就是20世纪80年代这种交易策略如何在摩根士丹利诞生的故事。布克斯达博是麻省理工学院的经济学博士,曾在多家很有名气的对冲基金和投资银行做过量化投资和风险管理的工作,包括10年在摩根士丹利,所以对这种策略的内幕了如指掌。别忘了弗雷在20世纪80年代曾在摩根士丹利的相关部门待过,他在简历上写道“在某投资银行改进其某种投资策略,使其的回报提高25%”,说的应该就是摩根士丹利和统计套利策略。布克斯达博在书里还讲到了另外一位超级量化基金管理人肖尔如何离开摩根士丹利,自己另起炉灶、使用这种策略交易的故事。所以,很多家公司所采用的这一类统计套利的策略或许都能追溯到摩根士丹利。这种“策略扩散”现象在对冲基金行业其实比较普遍:某种策略在某家银行或者基金诞生,如果运作很成功的话,不久就会有人出去自己开新的公司,复制这种策略。新公司的成员不久之后有可能跳槽,开自己的公司。没有几年的工夫,这种策略就到处都是。一个必然的后果是策略的回报下降,因为有效市场假说将获得最后的胜利。
在《我们自己设计的魔鬼》里面,布克斯达博是这样总结的:2002年以后,统计套利策略的表现开始滑坡,此后标准的统计策略(一个比较简单、比较标准的统计套利策略是这样的:首先选定一定数目的股票;计算方差——协方差矩阵(如果选了1000只股票,这将是一个1000×1000的大型矩阵);计算矩阵的特征向量和特征值;选取含有最大特征值的那个向量,预测该向量未来走势;计算所需要的多空股票组合。)一直也没有起色,其中主要的原因是有太多的钱在追踪这个策略。罗闻全教授的模拟运算证实了这一点,他说最近几年如果还想取得20世纪90年代前期的回报,那么杠杆必须增加2~4倍。但是,罗教授和布克斯达博说的是标准的策略,从事统计套利的各家基金都有各自不同的绝招,很可能有几种策略仍然在为它们的主人提供着印钞机的功能。但是我们知道,这是长不了的。从长远来看,有效市场假说将笑到最后。不过,在那之前,这些策略可能会使为数不多的几个人赚很多钱。
因为这种策略越来越流行,很多股票的短期价格走势在很大程度上受到统计套利交易的支配,所以市场上有这样的说法:“这只股票被统计套利给套上了”。如果被“套”上的话,这只股票的交易量会相应增加许多,它的价格走势也可能比较古怪。
超新星基金起初只是交易纳斯达克上市的股票,完全采取电子交易方式。20世纪90年代中叶,超新星基金的交易量占到纳斯达克相当大的份额,1997年有一天它的份额曾经达到14%。
从这个数字上我们还可以大致猜测一下大奖章基金的周转率和每笔交易的预期回报:假设它的年交易量是纳斯达克的5%,纳斯达克年交易量大概是10万亿美元,大奖章在纳斯达克的交易量就是5千亿美元,我们假定纳斯达克的交易量占到大奖章整个交易量的一半,它的年交易量为1万亿美元,但是一来一回算一笔交易,它的部位总额为5千亿美元,大奖章的资产是50亿美元,毛回报假定为80%,一年的利润应该是40亿美元。拿40亿美元除以5千亿美元得到0.8%,也就是说,它每笔交易的平均回报只有0.8%,这就是西蒙斯说的“小的机会”。拿5千亿美元除以50亿美元的资产得到100倍,意思是大奖章的年周转率为100倍,对共同基金来说已经超高了,但是对于高速交易的量化基金并不出奇。这当然是个非常粗略的猜测。
从弗雷的这段话里我们还可以看到这样的词——“试营运”。这在量化基金里面是比较常见的:有一个新的量化模型,在纸上很漂亮,但是在实际操作中如何呢?有很多统计、数学方法可以增强人们对某个量化标准的信心——光是看过去的模拟表现是很不够的——这一点我们在后面再详述。但即便是采取了种种方法,这些模型到了真枪实弹的战场上的表现谁也说不准,所以在实际操作中一般都会试营运一段。等到真实的表现和纸上的表现具有一定的可比性之后,才会加码。
另外一个值得注意的方面是上面两条提到的“收编”进大奖章的说法。这在量化基金操作中也很常见,因为已有的模型通常会“疲劳”,所以量化基金都有庞大的研究队伍来不断探索寻找新的模型。一旦经过试验之后某个模型的回报比较好,这个模型就会被收编进来。与此同时,老化的模型有可能被淘汰掉。这个过程其实需要很多经验,不可能是完全量化的。
- 设计和管理实施了一项自动交易系统。
提出了模型框架,组织研究团队将现代投资组合管理理论和技术性投资相结合,设计出新的证券交易模型。这个项目成了上述“超新星”基金的基础。
“现代投资组合管理理论和技术性投资相结合”,就是我们上面说的统计套利,我们也知道它的源头是摩根士丹利。
- 提出了风险管理模型,用于当时只有6000万美元的期货和债券基金。
在模型提出之前,平均回报为26%,提出之后,1991年回报为34%,1992年为39%,1993年为39%,1994年为71%,1995年为33%,1996年为32%。同期基金规模增加到8.8亿美元。
我们将上面的回报和大奖章的历史回报相比较,可以肯定,这个“期货和债券基金”指的就是当年的大奖章。我们可以推断,弗雷加入了之后大奖章才有了比较系统的风险管理模型:止损、杠杆管理、仓位分配等。风险管理模型是人们看量化基金的时候容易忽略的一个方面,人们通常只是关注模型是如何选股、如何预测的。其实军功章的另一半在貌不压人的风险管理模型里面:什么价位给某个仓位止损,投资组合出现何种亏损时给整个投资组合降低杠杆或者止损,各种模型的权重如何分配、如何调整,整个投资组合的杠杆如何调整,等等。这都会直接影响到基金的回报和风险,但是也常常被人忽略。
关于大奖章
所以,从以上弗雷对自己成就的描述中我们可以看出大奖章的历程:
- 首先是通过统计信息分析方法来判断外汇和债券短期的价格变化,尤其关注过激反应的一类。
- 在这个基础上加入了风险控制模型。
- 之后又引入了统计套利,开始高速交易大量股票。
- 接着又引入了统计套利的变种,低速交易大量股票。
- 继续引入其他模型,分析像现价交易指令表这样的不太常用的数据来源。
这就是大奖章。
当然,复兴技术的上百名专家不是天天坐在那里看电脑的。他们每天都可能提出新的想法,对已有模型的改进和补充肯定是在不断进行的。但是提出一个崭新的模型则需要时间,这通过弗雷12年在复兴技术的成就中不难看出来:12年也不过是两三个模型而已。
退休以后,弗雷除了忙石溪大学新的量化金融专业的事情之外,还从事很多慈善工作。他设立的弗雷基金会帮助家庭背景有问题的少年儿童,为他们提供教育及其他服务。
他在石溪大学的量化金融专业能不能培养出新的西蒙斯呢?这是个疑问。
第6章 更高、更强、更快
一则交易指令以接近光速的速度从美国的西海岸发到美国纽约,却已经被别人占了先机。在以毫秒、微秒为单位的量化投资的军备竞赛中,更高、更强、更快的电子交易究竟使金融行业雪中送炭还是雪上加霜?
有备无患
纽约股市的理发师
偷窥客人的秘密
要开一个新的量化基金?带上钱来就行了!
电脑交易的历史
雪中送炭还是雪上加霜
电子阅读
“截和”:对冲基金介入投资银行的地盘
联邦调查局介入
军备竞赛的社会意义
作者布克斯达博还提出了这样一个问题:这样的以毫秒、微秒为单位的军备竞赛,究竟对金融行业,甚至整个社会有没有带来好处呢?
他认为没有,虽说量化投资、算法交易、高频交易给市场带来了流动性,是好事,但是快几毫秒,对社会没有更多的好处,但为此银行和基金都花了大量的成本,所以净附加值为负数。他认为这就像冷战时期的军备竞赛,花了很多钱,劳民伤财。可是也有人指出,银行和基金都是自愿花钱的,这是市场的力量在起作用。而且,投资行业的巨大投资使得电脑芯片生产商能够有钱开发、制造更快的芯片,最后我们大家获益。我们现在的很多技术都得益于当年冷战时期军备竞赛的研究:卫星定位、万维网、很多家用电器,等等。
量化投资里面的高频交易、算法交易行业还比较新,当这类交易出现在新的市场的时候通常会降低交易成本,使投资人获利,所以我们认为很多市场都将会因为它们的出现而获益,但是竞争到一定程度的时候是不是会向恶性的方向发展呢?这是可能的,也将是未来数年中监管、学术和行业本身要思考和回答的问题。
最后补充一句,我们认为量化投资或者算法交易总的来说应该对市场有益,但这并不意味着我们认为投资者——尤其是散户投资者——应该去研究、使用这类方法。有的人可能在想:不能赚到西蒙斯那样多的钱,有个百分之一、千分之一也不错嘛。全球真正能靠这类方法稳定赚钱的基金屈指可数,这就说明了这类方法的难度,就连已经是亿万富翁的肖尔也说,如果让他重新开始的话,他不会选择算法交易这条路,因为付出太大,而成功的可能性又太低,他说别的投资方法赚钱的性价比要好很多。西蒙斯总是说起他成功的运气成分,这不应当仅仅理解成他的谦辞。市场所有交易人频繁交易在短期内的总附加值是零,所以西蒙斯年复一年赚到的钱归根结底都是别的投资人频繁交易输掉的钱。
第7章 飓风里行船只往后看
量化交易并不是一座取之不竭的金矿,过度的数据挖掘已经给量化投资敲响了警钟,有限的市场容量也已经成为量化投资发展的瓶颈。历史可以说是正在进行中的过去时,它既可能重复。也可能更改。
25倍标准差事件
2007年7、8月间,量化基金遭到“血洗”,连平常保持沉默的西蒙斯也不得不给投资人写信解释情况。损失最大的基金集中在统计套利这种策略上,很多这类基金同时出现高额亏损,这是比较罕见的。通常即便在市场对某种策略不利的时候,因为各种不同的基金使用的同类策略会各不相同,所以亏损的程度也都会不同。但这一次几乎所有的统计套利基金都赔得很惨。摩根士丹利的量化基金据说在一天之内赔了超过3.9亿美元,远远超过风险控制的下限。高盛财务总监说连续数日出现25倍标准差的市场价格变化,高盛的两只以量化为主的基金8月分别亏损了23%和30%。有些人惊呼:这是量化基金百年一遇的风暴。也有一位教授冷静地说:“25倍标准差的市场价格变化?宇宙的年龄都不够我们观测到16倍标准差的事件呢!”
很多人认为,这个现象的出现正是因为过多的资金在追随同一个策略,超出了市场的容量。而在退出的过程中,大家都争相冲向大门,所以使情况进一步恶化。虽说复兴技术公司管理的机构投资人股票基金所受到的亏损小于很多竞争对手的亏损,但是也有人评论说即便是天下最聪明的头脑也无法对抗变化莫测的市场,而长期资本管理就是前车之鉴。
正是因为西蒙斯过去的成功,很多量化基金纷纷效仿复兴技术的各种策略,最后导致它们的头寸很相似。比如,2007年6月,根据各大基金给美国证交会上报的文件,复兴技术的机构投资人股票基金的前10大股票部位里面有4只股票和另一个专门从事量化投资的基金重叠。随着当时美国次贷问题的恶化,许多与房屋相关的行业的股票、债券受到影响,按揭证券化资产的价格下跌,给对冲基金贷了很多钱的银行开始要求收回贷款,并且要求对冲基金增加抵押资产,这使得有些量化基金不得不平仓止损。但是因为它们的部位相似,杠杆通常很高,一家开始平仓会引发连锁反应,使那些被做空的股票价格螺旋上升,那些被做多的股票价格螺旋下降。
这也说明了一个问题:股票被统计套利盯上本身已经变成了一个风险因素,但是统计套利的复杂模型则没有考虑到这一点。
在最近5年里,过去采取超短线高频统计套利策略的基金,包括复兴技术和DE肖尔公司开始使用比较长线的模型,主要是为了增加交易容量,减少流动性风险。但是,使用传统比较长线的股票多空策略的基金开始使用比较短线的模型,因为它们的技术能力在提高,这样做也是为了使风险多元化。多空策略基金的数量也大幅度增加。全球很多市场上,共同基金纷纷推出了一类新的基金产品,叫130∶30基金,这类基金可以做空30%的仓位,做多130%,从而保持共同基金净杠杆最多不超过100%的限制,但是同时又介入了对冲基金的领地:股票多空策略。所有的这些策略,虽说细节各异但都是按照马科维茨的理论来构建投资组合的,采用的历史数据大同小异,所以这些林林总总的基金持货相近不足为奇。即便是那些按照宏观方法投资的基金也常常会采用类似的理论来构建投资组合,所以当小的波动出现,庞大的人流一起冲向大门时,很多基金会损失惨重。
警钟还是丧钟
数据挖掘
第8章 谁有下一个点石成金的手指
统计学、数学、运筹学、量子物理学、信息学……这些量化投资中最基本的金刚钻,能否在翻云覆雨的模型中预测出下一个西蒙斯的生辰八字?这是一场机器与人的博弈,也将是另一段量化投资的传奇。
金刚钻和瓷器活
下一个像西蒙斯这样的人物究竟会在哪儿出现呢?
我们最近收到一份广告,一个关于量化投资和自动交易的“大师讲座”,2009年10月将在伦敦举行。讲座包括以下的内容:
- 偏差:数据窥视、存活者偏差、超前。
- 回溯测试价格规律。包括最新的规律辨认研究,双顶、双底和其他短期规律。
- 风险估测矩阵和模型表现。
- 赫斯特指数、混沌理论和金融市场行为。为什么混沌理论用在金融市场上表现欠佳;新的使用混沌理论的方法;辨认趋势和趋势反转市场环境。
- 用制表软件做回溯测试。
- 开发止损和止盈战略。
- 强行更改模型和模型故障。
为期一天的讲座,注册费用超过四万元人民币!看看这个讲座的内容,再联系到这本书前面已经说过的各种有关量化投资的东西,我们猜测通过这个讲座学到能够赚钱的量化模型的可能性是非常低的。所谓的大师讲座也无非如此。