理解投资中的概率
理解投资中的概率
投资中一个很重要但是很容易被忽略的方面,就是我们都清楚投资的不确定性很高,但是很少去看概率分布。
假设有三种情况,
1. 一支股票30%的概率长50%,70%的概率长40%,期望收益率44%。
2. 一支股票50%的概率长50%,50%的概率长30%,期望收益率40%。
3. 一支股票30%的概率长60%,70%的概率长15%,期望收益率28.5%。
如果给我看期望收益率,我最喜欢是第一个,但是给我看分布我最喜欢第三个。为什么?因为在不确定性很高的世界里面,唯一能够持续存活的方式就是确保你在最差场景下能活下来。而关于分布的决策能够让我们更好地管理downside risk。
概率分布还提供了一种思考世界运作方式的角度。
有很多历史发展是符合所谓的幂律分布(power law),也有很多是符合正态分布(normal distribution)。两者都是很优美的曲线,但是意义却完全不一样。如果以人类寿命为例,人类寿命可以说就是一个正态分布。最重要原因不是平均数附近最多,而是说边界很清楚。人类寿命预期不管是什么数字,一定不会超过两倍于平均值的。而很多时候身高/体重也可以用类似的逻辑去思考,假如平均身高一百七十厘米,那么世界上不会有人身高三米四(排除像巨人症这样的疾病)。
网络效应和传播有关的很多情况都是符合幂律分布。社交网络中无论是粉丝数量,视频的播放量,传染病传播的R naught等等。幂律分布比较明显的特征就是极端值的出现概率要比想象中的高得多。
虽然说概率分布本身没有直接提供任何关于世界的信息,但是如果我们观察到一个现象符合某一种分布的话,我们其实能够知道很多关于这个现象背后逻辑的事情。比如,如果我们看到某样东西是正态分布的话,我们大概率可以认为这个底层的过程是central limit theorem的。
举一个概率分布思考问题的例子:如果所有人在股市里的交易都是随机的,我们会得到什么样的概率分布?买得最准的人大概率就是刚好赌对的那个人而已,但如果投资的整个市场就是一个near-random的世界,那么回报就应该符合正态分布,相对于平均而言高于平均回报一倍的人就不应该存在。类似的,我们可以思考寿命的问题:一个人活到70的概率跟他是否已经活了60年有关系吗?或是说,如果某个基金经理过去的回报都很好,那我们应该期待得到什么样的回报概率分布?
如果我们能够结合概率分布,最理想状态其实是可以进一步去考虑贝叶斯概率(Bayesian),我们永远不能知道一个骰子出来1的概率是百分之多少,但我们对这个概率的认知会随着我们观察到的数据而改变。
对于凯利策略,还有一个问题没有搞明白,如何估计获利倍数b和胜率p?
均值回归与"运气"
我们能够用到的第一个工具是均值回归。
树不会长上天。抛硬币也不可能永远朝上。
很容易理解。
但是难以理解的是每次抛都是50%的硬币,为什么连续抛了几个正面之后,好像再抛到正面的概率会变小。
让我们先忘掉计算伯努利试验的二项分布,我们真的能够在直觉上理解这件事情吗?
是因为硬币自己在计算运气吗?每多抛一次就会用一点,直到某一次用完?
其实问题出在那个50%。问一个小学生硬币正面朝上的概率是多少,他会告诉你是50%。但这个数是怎么来的?什么意思?难道说抛硬币的那一刻世界会分裂成两个,一个人看到正面朝上,一个看到反面朝上吗?
随便翻开一本讲概率的书,会告诉我们:
1. 抛同一枚均匀的硬币,不要控制怎么抛,不要磕碰(有那种一面比较重的硬币,正面朝上概率不是50%;也有人造出来过投币机,精确保证次次朝上)
2. 一直抛,每一百次数一数多少次正面朝上
3. 会发现随着抛得次数增多 ,100次里正面朝上次数越来越接近50次
所以其实根本不是硬币自己在数,而是我们拿出一枚硬币说它正面朝上概率是50%的时候就已经提前数过了!
每次抛都是50%的硬币,为什么连续抛了几个正面之后,再抛到正面的概率会变小。
这是典型的赌徒谬论(gambler's fallacy)。
只要最基本的物理关系不变,硬币本身是正是反的倾向是不会变的,硬币自己是没有记忆的。
并没有一个会被用完的运气,但当你抛到八个正面的时候,你应该庆幸自己是幸运的。
之所以会回归是因为存在一个均值。说明虽然有随机性,但是随机的成分(极端值和均值之间不相关的部分)至少还是有一个"谱"的,事情不会特别离谱。
不管怎么说,我们还是在抛同一枚硬币,而且我们认为前后两个不同时间,不同的位置决定硬币正反的因素还是大差不差的(物理学家把这个叫做对称性)。
但是"事情一般不会特别离谱"这件事,并不是一个像牛顿力学一样的自然规律,它只不过来自我们对于均值的定义。很难说固定均值的存在是由于硬币所具有的某些性质,还是因为我们的看法。
那么什么时候会离"谱"?
几种情况:
1. 趋势。比如近年中国GDP。这个是不会回归清代GDP的。虽然都叫GDP,但是工业化、城市化后的经济和小农经济已经不是同一个东西了。
2. 断层。发现天花疫苗之前和之后,死亡率均值是完全不一样的。
3. 随机性的成分是会累积的,而且不会因为时间的推移而消散。
第三种又叫随机漫步,因为这个过程就像一个醉汉走路一样,摇着摇着就不知道走到哪儿去了,根本不会回来。
学院派的教科书里,股票是经典的随机漫步,没有一个均值,所以也没人能根据过去的价格猜到未来股价会往哪里走。
醉汉走得太偏会走到沟里去,一个公司的价值真的可以无穷大吗?
巧合
均值回归的意思是巧合很难发生。
但是巧合是会发生的。巧合发生的概率到底有多小?
抛硬币十次,8次以上正面朝上是巧合吗?
好像可以这么说。
8次以上正面朝上的概率有多小?
我们算一算
P(抛10次多于8个正面)=5.74%
P(抛20次多于16个正面)=0.13%
P(抛30次多于24个正面)=0.02%
发现竟然几乎是5%!
一百个人里会有5个人发现自己看到了8个以上的正面。只有随着样本逐渐增多,抛到80%正面的比例才慢慢变小。
小样本中,巧合发生的概率远远比我们想象中要大。人又是特别喜欢给事情想出一个解释的(这就是为啥成功学/阴谋论那么受欢迎)。所以我们很容易忽略样本大小,从巧合之中看出假的规律。而在巧合面前,我们很容易忽视那个"谱"。
赌博中发展出的主观概率论
如何能够排除巧合对我们看法的影响?
首先,我们需要重新认识概率这个东西。
世界上根本没有人能够找到一个正面朝上概率50%的硬币。因为要证明概率是50%,需要把这个硬币投无穷多次。然后这个可怜的朋友这辈子就得抛硬币了,死的时候还需要后代来接班。
为什么一定要无穷多次?因为我们并不能说1000次或者1000万次就足够得好。想象一个比较恐怖的情况,一个农场有一只猪(假设这只猪如果没人杀可以长生不老)。如果这只猪去预测它明天被杀的概率,它会怎么想?
但这并不妨碍我们觉得硬币朝上的概率是50%。我们可以认为概率根本就不是从现实世界中可以测量出来的东西(比如硬币的某种属性),它跟之前讨论的效用一样是我们脑中的一种看法。
我们会不断根据新的信息更新我们对于某一件事的看法。虽然可怜的猪没有办法想出自己某一天被杀的概率。但是这个农场的农场主可以干下面的事情:
1. 统计一下每一只猪养到多少天被杀
2. 把天数加总,算个平均(或者最好做一个统计猪寿命的条形图,左边小右边大)
3. 看看某一只活猪养了多少天,离这个平均有多远
农场主不仅可以算概率,心里有个谱,还可以考虑开一个农家乐赌场,赌局是一只猪活过800天的话,你能够得到100块。我们可以从这个人肯付多少钱参加游戏,了解到这个人脑中相信的一只猪活过800天的概率到底是多少。
信息与条件概率
如果我们发现之前都是800天后杀猪,有一天一只猪养了500天就被杀了。后面10头猪活过800天概率究竟怎么变?
可能是农场主口味变了(假设农场主不会为了赚赌客钱而早杀猪),有一天突然说想吃嫩一点的。以后都会是500天前后杀猪了吗?
但是杀猪天数这个事情是不是还是有均值的,比如有某种人道主义规定,需要让每只猪先度过快乐青春?杀猪天数会不会向均值回归?
那么为上面一只猪活过800天,你能够得到100块这个赌局,你愿意付多少?
我们似乎又在给一个现象想出一个因果解释。
但是如果这么定义概率的话,会是一个极其看心情的东西,一个人脑海里的概率取决于乐观还是悲观,觉得这猪活的时间长还是短,认为均值回归的幅度是大还是小。