一部关于数学、博弈与自我的探索史


引言:当数学遇见不确定性

1900年,巴黎证券交易所门口,一位名叫路易·巴舍利耶(Louis Bachelier)的法国数学家,发表了一篇名为《投机理论》的博士论文。

论文的核心观点是:股票价格运动类似于布朗运动,是一个随机过程。

当时的华尔街没有人读这篇论文。60年后,经济学家们才”重新发现”了这篇论文的价值。

这是一个隐喻:量化投资的命运,从一开始就注定了——它总是领先于时代,然后被时代追赶。


第一章 数学的黎明:1900-1960

1.1 随机游走:市场的第一个数学模型

巴舍利耶在1900年提出了著名的”随机游走”假说。

这个公式描述了股价变动的概率分布——它假设未来的价格变动与过去无关,每一刻都是独立的随机事件。

这是一个深刻的哲学命题:市场可以被预测吗?

如果股价真的是随机游走,那么:

  • 任何技术分析都是无效的(因为过去不能预测未来)
  • 没有人能持续”打败市场”
  • 只有”傻傻”地持有指数基金才是最优策略

这就是现代金融学的基石:有效市场假说

当然,后来人们发现市场并不完全有效——这就有了量化的机会。

1.2 凯利公式:索普的入场券

1956年,贝尔实验室的约翰·凯利(John Kelly)在一篇论文中提出了著名的”凯利公式”:

f=bpqb=p(b+1)1bf^* = \frac{bp - q}{b} = \frac{p(b+1) - 1}{b}

其中:

  • pp = 赢的概率
  • q=1pq = 1-p = 输的概率
  • bb = 盈亏比

凯利公式的精髓:不在于告诉你押多少,而在于告诉你什么时候该离开牌桌。

当胜率×盈亏比 < 1时,最好的策略是不参与。

“只在赢面大的事情上下注。” — 凯利

1.3 索普:第一个征服赌场的人

爱德华·索普(Edward Thorp)是一个数学家。1962年,他出了一本书《战胜庄家》(Beat the Dealer),告诉人们怎么在21点中赢钱。

21点的基本策略:

  • 当牌堆里”十点牌”(10、J、Q、K、A)多的时候,玩家优势更大
  • 当”小额牌”(2-9)多的时候,庄家优势更大
  • 通过算牌,玩家可以把胜率从48%提高到50%

50%意味着什么?

每玩100把,玩家平均赢51把,输49把。

加上凯利公式的资金管理,就能稳定盈利。

索普做了什么:

  1. 用数学证明21点可以被战胜
  2. 发明了具体的算牌方法
  3. 真的去拉斯维加斯赢了几十万美元
  4. 迫使赌场修改规则

但索普的真正贡献是思维范式:

“赌博是一种简化的投资方式。两者都可以用数学、统计学和计算机来分析。”

1967年,索普成立了可转换对冲基金,从拉斯维加斯搬到华尔街。

他把在赌场里学到的数学方法,用在了股票市场上。

这就是量化投资的起点:用数学和纪律,战胜人性的弱点。


第二章 华尔街的革命:1960-1980

2.1 现代投资组合理论:马科维茨的答案

1952年,哈里·马科维茨(Harry Markowitz)发表了现代投资组合理论的奠基之作。

核心问题:

给定一组风险资产,如何分配权重使得收益最大化同时风险最小化?

马科维茨的洞察:资产的”相关性”比单个资产的收益更重要。

通过组合低相关甚至负相关的资产,可以获得”免费的午餐”——即分散化收益。

“不要把鸡蛋放在一个篮子里。” — 这句古老谚语的数学证明

2.2 CAPM:市场是否有效?

1964年,威廉·夏普(William Sharpe)提出了著名的CAPM模型:

E(Ri)=Rf+βi(E(Rm)Rf)E(R_i) = R_f + \beta_i (E(R_m) - R_f)

其中 βi=Cov(Ri,Rm)Var(Rm)\beta_i = \frac{\text{Cov}(R_i, R_m)}{\text{Var}(R_m)}

CAPM的深层含义:

  1. 只有系统性风险才有风险溢价
  2. 个股/组合的收益完全由Beta决定
  3. 如果市场有效,则无人能获得超额收益(Alpha)

这是量化投资的两难:如果CAPM正确,则量化无用;如果量化有用,则CAPM错误。

2.3 期权定价革命:Black-Scholes公式

1973年,费希尔·布莱克(Fischer Black)和罗伯特·默顿(Merton)发表了Black-Scholes期权定价公式。

这个公式的革命性在于:它把期权价格变成了一个”机械”的可计算问题。

交易员不再需要”感觉”期权值多少钱,只需要把参数代入公式。

华尔街由此进入了”金融工程”时代。


第三章 黄金时代:1980-2000

3.1 西蒙斯与文艺复兴:大奖章的奇迹

1977年,数学家詹姆斯·西蒙斯(James Simons)创立了文艺复兴科技。

1989年起,大奖章基金(Medallion Fund)开始创造奇迹:

  • 年化收益率:~35%
  • 费后收益:~39%
  • 连续30多年正收益

“我信奉数学模型。当模型失效时,我相信更复杂的模型。” — 西蒙斯

但西蒙斯从不公开他的模型。原因深刻:

  1. 模型无法用语言表达 - 几千个因子的非线性组合
  2. 说出来就不灵了 - 市场是博弈的
  3. 数学家相信系统 - “有效就继续,无效就换”

3.2 LTCM的崩溃:杠杆的陷阱

1998年,长期资本管理公司(Long Term Capital Management)崩溃。

这家由两位诺贝尔经济学奖得主(罗伯特·默顿、迈伦·斯科尔斯)创立的对冲基金,曾在4年内获得年化40%的收益。

然后在1998年8月,俄罗斯金融危机中,34天内亏损45亿美元,最终破产。

LTCM的教训:

  1. 小概率事件不是”不可能事件” - 模型假设的”极端情况”,在现实中可能比预期更频繁
  2. 杠杆是放大器 - 无论多聪明的策略,在杠杆面前都可能归零
  3. 相关性会突变 - 危机时刻,所有资产的相关性趋近于1

“数学模型可以算到99%,但市场永远存在那1%的黑天鹅。“

3.3 量化投资的流派分化

这一时期,量化投资形成了三大流派:

学术派(AQR模式)

  • 与学术界深度合作,发表大量论文
  • 因子投资、风险溢价研究
  • 代表:Asness, Fama, French

科技派(文艺复兴模式)

  • 数学家团队,封闭模型
  • 高频交易、算法套利
  • 代表:Simons, DE Shaw

实战派(Two Sigma模式)

  • 工程化流水线
  • 因子挖掘、组合优化
  • 代表:Two Sigma

第四章 中国的量化之路:2000-至今

4.1 2010年:中国量化元年

沪深300股指期货推出,中国量化投资正式起步。

早期的中国量化有几个特点:

  • 策略简单:以市场中性、套利为主
  • 规模小:管理规模几千万到几亿
  • 人才少:海归+本土量化研究者

4.2 2015年:冰与火之歌

2015年6月12日,A股达到5178点峰值。

随后3周内,暴跌至2850点。

量化私募被推上风口浪尖:“做空主力”、“砸盘元凶”。

真实数据:

  • 量化私募管理规模:约3万亿(占A股流通市值3%)
  • 大多数量化策略:市场中性(做多股票+做空期货)
  • 暴跌主因:杠杆泡沫,不是量化

4.3 四大天王的崛起

2015年后,中国量化私募形成了”四大天王”格局:

机构特点核心能力
幻方(High-Flyer)AI驱动萤火系列算力基础设施
九坤多策略因子库、组合优化
明汯规模优先策略容量
致远主观+量化宏观研判

4.4 梁文锋的路径:从8万到330亿

2008年,一位浙江大学毕业生带着8万元本金,开始了独立量化交易之路。

关键时间线:

  • 2008年:8万元本金,成都出租屋
  • 2010年:沪深300期货推出,自营资金突破5亿
  • 2015年:年化收益>100%,进入”亿元俱乐部”
  • 2016年:All in AI,比AlphaGo还早
  • 2019年:萤火一号(2亿+1100 GPU)
  • 2021年:萤火二号(10亿+1万A100),管理规模破千亿
  • 2023年:创立DeepSeek,进军AGI
  • 2025年:DeepSeek-R1发布,震动全球AI界

梁文锋的洞察:

“中国AI不可能永远跟随。“


第五章 策略的本质:数学、博弈与统计

5.1 Alpha的来源

Alpha的本质 = 预测能力

Rportfolio=α+βFactor+εR_{portfolio} = \alpha + \beta \cdot Factor + \varepsilon

Alpha来自三个地方:

  1. 信息差 - 内幕/独家数据
  2. 处理能力差 - 别人没发现的规律
  3. 执行差 - 更好的算法/更低的手续费

5.2 因子模型演进

CAPM (1964): 只有一个因子:市场收益

Fama-French三因子 (1993):

  • 市场因子
  • 市值因子(SMB):小市值 - 大市值
  • 价值因子(HML):低PE - 高PE

Barra模型:

  • 行业因子 + 风格因子(Size, Value, Momentum, Volatility…)

5.3 因子有效性检验

IC (Information Coefficient):

  • IC > 0.03: 有效因子
  • IC > 0.05: 强因子

IR (Information Ratio):

  • IR > 0.5: 值得实盘

5.4 一个深刻的矛盾

  • 发现有效规律 → 赚钱
  • 赚钱 → 别人复制
  • 别人复制 → 规律失效
  • 所以必须不断发现新规律

这是一个永无止境的军备竞赛。


第六章 实战要点:从理论到实践

6.1 数据处理常见坑

陷阱影响解决方案
上市不满2年财报不稳定剔除
停牌期间价格无法交易用前收盘价
涨跌停实际无法成交标记处理
前视偏差用未来信息严格时间点

6.2 过拟合陷阱

信号与噪声比: 1000个因子中,可能只有5个真正有效。

解决方法:

  1. 样本外测试 (Walk-Forward)
  2. 交叉验证 (K-Fold)
  3. 简洁优先 (Occam’s Razor)
  4. 物理意义 (因子逻辑可解释)

6.3 滑点成本

假设:

  • 单笔滑点: 0.01%
  • 日换手: 100%
  • 年交易日: 250

年化滑点成本 = 0.01% × 100% × 250 = 2.5%

这意味着策略年化收益至少要 > 2.5% 才有意义。


第七章 风险管理的哲学

7.1 风险层次

层级指标阈值
组合VaR日VaR < 2%
持仓单票敞口< 5%
策略最大回撤< 15%

7.2 动态风控

  • 止损: 单日亏损 > 2% → 降仓50%
  • 波动率控制: 年化 > 20% → 减仓
  • 最大回撤: > 15% → 全面风控

第八章 批判性反思

8.1 量化的局限

  1. 数据依赖 - 过去的数据 ≠ 未来的规律
  2. 过拟合陷阱 - 回测完美 ≠ 实盘盈利
  3. 流动性约束 - 小市值策略无法放大
  4. 模型风险 - 2020年3月,量化基金集体回撤

8.2 量化的真正价值

不是”稳赚”,而是:

  1. 纪律性 - 克服情绪弱点
  2. 可复制性 - 策略可以规模化
  3. 可解释性 - 知道为什么赚钱/亏钱
  4. 可迭代 - 不断适应市场

8.3 主观 vs 量化:一个伪命题

“量化本质上是统计套利,是统计过往的规律。市场是在变化的,如果下一年和过往完全不同,它肯定有一段时间就糊涂了。” — 郭学文 (茂源资本)

主观和量化的区别不在于”谁更好”,而在于:

  • 主观:依赖个人判断,决策快,但受情绪影响
  • 量化:依赖模型纪律,系统性强,但需要迭代

未来的趋势是融合:

“七分量化,三分主观。” — 盛丰衍 (西部利得基金)


结语:谦卑与进取

量化投资的本质,是一个哲学问题:

这个世界可以被数学描述吗?

如果可以 → 量化是终极答案 如果不可以 → 量化只是一个阶段性工具

索普用了60年证明了一件事:

市场可以部分被预测,但永远不会被完全征服。

这或许就是量化的终极领悟:

谦卑地承认不确定性,是量化最大的确定。

但正是这种”知道不能完全征服”的谦卑,让量化投资者不断前行——

因为每一次模型的失效,都是下一次进步的起点。


附录一:关键年份

年份事件
1900巴舍利耶随机游走理论
1956凯利公式诞生
1962索普《战胜庄家》出版
1967索普进入华尔街
1973Black-Scholes模型
1977文艺复兴科技成立
1987黑色星期一
1989大奖章基金启动
1998LTCM崩溃
2010沪深300期货推出
2015中国量化爆发/股灾
2016幻方All in AI
2023DeepSeek进军AGI

附录二:进阶书单

数学/统计:

  • 《概率论与数理统计》
  • 《随机过程》- Shreve
  • 《金融工程》- Hull

量化投资:

  • 《主动投资组合管理》- Grinold
  • 《Quantitative Trading》- Chan

因子投资:

  • 《因子投资》- Rivera

本文版本:2026-03-06 参考资料:兴业证券报告、凤凰网、有知有行、雪球等