一部关于数学、博弈与自我的探索史
引言:当数学遇见不确定性
1900年,巴黎证券交易所门口,一位名叫路易·巴舍利耶(Louis Bachelier)的法国数学家,发表了一篇名为《投机理论》的博士论文。
论文的核心观点是:股票价格运动类似于布朗运动,是一个随机过程。
当时的华尔街没有人读这篇论文。60年后,经济学家们才”重新发现”了这篇论文的价值。
这是一个隐喻:量化投资的命运,从一开始就注定了——它总是领先于时代,然后被时代追赶。
第一章 数学的黎明:1900-1960
1.1 随机游走:市场的第一个数学模型
巴舍利耶在1900年提出了著名的”随机游走”假说。
这个公式描述了股价变动的概率分布——它假设未来的价格变动与过去无关,每一刻都是独立的随机事件。
这是一个深刻的哲学命题:市场可以被预测吗?
如果股价真的是随机游走,那么:
- 任何技术分析都是无效的(因为过去不能预测未来)
- 没有人能持续”打败市场”
- 只有”傻傻”地持有指数基金才是最优策略
这就是现代金融学的基石:有效市场假说。
当然,后来人们发现市场并不完全有效——这就有了量化的机会。
1.2 凯利公式:索普的入场券
1956年,贝尔实验室的约翰·凯利(John Kelly)在一篇论文中提出了著名的”凯利公式”:
其中:
- = 赢的概率
- = 输的概率
- = 盈亏比
凯利公式的精髓:不在于告诉你押多少,而在于告诉你什么时候该离开牌桌。
当胜率×盈亏比 < 1时,最好的策略是不参与。
“只在赢面大的事情上下注。” — 凯利
1.3 索普:第一个征服赌场的人
爱德华·索普(Edward Thorp)是一个数学家。1962年,他出了一本书《战胜庄家》(Beat the Dealer),告诉人们怎么在21点中赢钱。
21点的基本策略:
- 当牌堆里”十点牌”(10、J、Q、K、A)多的时候,玩家优势更大
- 当”小额牌”(2-9)多的时候,庄家优势更大
- 通过算牌,玩家可以把胜率从48%提高到50%
50%意味着什么?
每玩100把,玩家平均赢51把,输49把。
加上凯利公式的资金管理,就能稳定盈利。
索普做了什么:
- 用数学证明21点可以被战胜
- 发明了具体的算牌方法
- 真的去拉斯维加斯赢了几十万美元
- 迫使赌场修改规则
但索普的真正贡献是思维范式:
“赌博是一种简化的投资方式。两者都可以用数学、统计学和计算机来分析。”
1967年,索普成立了可转换对冲基金,从拉斯维加斯搬到华尔街。
他把在赌场里学到的数学方法,用在了股票市场上。
这就是量化投资的起点:用数学和纪律,战胜人性的弱点。
第二章 华尔街的革命:1960-1980
2.1 现代投资组合理论:马科维茨的答案
1952年,哈里·马科维茨(Harry Markowitz)发表了现代投资组合理论的奠基之作。
核心问题:
给定一组风险资产,如何分配权重使得收益最大化同时风险最小化?
马科维茨的洞察:资产的”相关性”比单个资产的收益更重要。
通过组合低相关甚至负相关的资产,可以获得”免费的午餐”——即分散化收益。
“不要把鸡蛋放在一个篮子里。” — 这句古老谚语的数学证明
2.2 CAPM:市场是否有效?
1964年,威廉·夏普(William Sharpe)提出了著名的CAPM模型:
其中
CAPM的深层含义:
- 只有系统性风险才有风险溢价
- 个股/组合的收益完全由Beta决定
- 如果市场有效,则无人能获得超额收益(Alpha)
这是量化投资的两难:如果CAPM正确,则量化无用;如果量化有用,则CAPM错误。
2.3 期权定价革命:Black-Scholes公式
1973年,费希尔·布莱克(Fischer Black)和罗伯特·默顿(Merton)发表了Black-Scholes期权定价公式。
这个公式的革命性在于:它把期权价格变成了一个”机械”的可计算问题。
交易员不再需要”感觉”期权值多少钱,只需要把参数代入公式。
华尔街由此进入了”金融工程”时代。
第三章 黄金时代:1980-2000
3.1 西蒙斯与文艺复兴:大奖章的奇迹
1977年,数学家詹姆斯·西蒙斯(James Simons)创立了文艺复兴科技。
1989年起,大奖章基金(Medallion Fund)开始创造奇迹:
- 年化收益率:~35%
- 费后收益:~39%
- 连续30多年正收益
“我信奉数学模型。当模型失效时,我相信更复杂的模型。” — 西蒙斯
但西蒙斯从不公开他的模型。原因深刻:
- 模型无法用语言表达 - 几千个因子的非线性组合
- 说出来就不灵了 - 市场是博弈的
- 数学家相信系统 - “有效就继续,无效就换”
3.2 LTCM的崩溃:杠杆的陷阱
1998年,长期资本管理公司(Long Term Capital Management)崩溃。
这家由两位诺贝尔经济学奖得主(罗伯特·默顿、迈伦·斯科尔斯)创立的对冲基金,曾在4年内获得年化40%的收益。
然后在1998年8月,俄罗斯金融危机中,34天内亏损45亿美元,最终破产。
LTCM的教训:
- 小概率事件不是”不可能事件” - 模型假设的”极端情况”,在现实中可能比预期更频繁
- 杠杆是放大器 - 无论多聪明的策略,在杠杆面前都可能归零
- 相关性会突变 - 危机时刻,所有资产的相关性趋近于1
“数学模型可以算到99%,但市场永远存在那1%的黑天鹅。“
3.3 量化投资的流派分化
这一时期,量化投资形成了三大流派:
学术派(AQR模式)
- 与学术界深度合作,发表大量论文
- 因子投资、风险溢价研究
- 代表:Asness, Fama, French
科技派(文艺复兴模式)
- 数学家团队,封闭模型
- 高频交易、算法套利
- 代表:Simons, DE Shaw
实战派(Two Sigma模式)
- 工程化流水线
- 因子挖掘、组合优化
- 代表:Two Sigma
第四章 中国的量化之路:2000-至今
4.1 2010年:中国量化元年
沪深300股指期货推出,中国量化投资正式起步。
早期的中国量化有几个特点:
- 策略简单:以市场中性、套利为主
- 规模小:管理规模几千万到几亿
- 人才少:海归+本土量化研究者
4.2 2015年:冰与火之歌
2015年6月12日,A股达到5178点峰值。
随后3周内,暴跌至2850点。
量化私募被推上风口浪尖:“做空主力”、“砸盘元凶”。
真实数据:
- 量化私募管理规模:约3万亿(占A股流通市值3%)
- 大多数量化策略:市场中性(做多股票+做空期货)
- 暴跌主因:杠杆泡沫,不是量化
4.3 四大天王的崛起
2015年后,中国量化私募形成了”四大天王”格局:
| 机构 | 特点 | 核心能力 |
|---|---|---|
| 幻方(High-Flyer) | AI驱动 | 萤火系列算力基础设施 |
| 九坤 | 多策略 | 因子库、组合优化 |
| 明汯 | 规模优先 | 策略容量 |
| 致远 | 主观+量化 | 宏观研判 |
4.4 梁文锋的路径:从8万到330亿
2008年,一位浙江大学毕业生带着8万元本金,开始了独立量化交易之路。
关键时间线:
- 2008年:8万元本金,成都出租屋
- 2010年:沪深300期货推出,自营资金突破5亿
- 2015年:年化收益>100%,进入”亿元俱乐部”
- 2016年:All in AI,比AlphaGo还早
- 2019年:萤火一号(2亿+1100 GPU)
- 2021年:萤火二号(10亿+1万A100),管理规模破千亿
- 2023年:创立DeepSeek,进军AGI
- 2025年:DeepSeek-R1发布,震动全球AI界
梁文锋的洞察:
“中国AI不可能永远跟随。“
第五章 策略的本质:数学、博弈与统计
5.1 Alpha的来源
Alpha的本质 = 预测能力
Alpha来自三个地方:
- 信息差 - 内幕/独家数据
- 处理能力差 - 别人没发现的规律
- 执行差 - 更好的算法/更低的手续费
5.2 因子模型演进
CAPM (1964): 只有一个因子:市场收益
Fama-French三因子 (1993):
- 市场因子
- 市值因子(SMB):小市值 - 大市值
- 价值因子(HML):低PE - 高PE
Barra模型:
- 行业因子 + 风格因子(Size, Value, Momentum, Volatility…)
5.3 因子有效性检验
IC (Information Coefficient):
- IC > 0.03: 有效因子
- IC > 0.05: 强因子
IR (Information Ratio):
- IR > 0.5: 值得实盘
5.4 一个深刻的矛盾
- 发现有效规律 → 赚钱
- 赚钱 → 别人复制
- 别人复制 → 规律失效
- 所以必须不断发现新规律
这是一个永无止境的军备竞赛。
第六章 实战要点:从理论到实践
6.1 数据处理常见坑
| 陷阱 | 影响 | 解决方案 |
|---|---|---|
| 上市不满2年 | 财报不稳定 | 剔除 |
| 停牌期间价格 | 无法交易 | 用前收盘价 |
| 涨跌停 | 实际无法成交 | 标记处理 |
| 前视偏差 | 用未来信息 | 严格时间点 |
6.2 过拟合陷阱
信号与噪声比: 1000个因子中,可能只有5个真正有效。
解决方法:
- 样本外测试 (Walk-Forward)
- 交叉验证 (K-Fold)
- 简洁优先 (Occam’s Razor)
- 物理意义 (因子逻辑可解释)
6.3 滑点成本
假设:
- 单笔滑点: 0.01%
- 日换手: 100%
- 年交易日: 250
年化滑点成本 = 0.01% × 100% × 250 = 2.5%
这意味着策略年化收益至少要 > 2.5% 才有意义。
第七章 风险管理的哲学
7.1 风险层次
| 层级 | 指标 | 阈值 |
|---|---|---|
| 组合 | VaR | 日VaR < 2% |
| 持仓 | 单票敞口 | < 5% |
| 策略 | 最大回撤 | < 15% |
7.2 动态风控
- 止损: 单日亏损 > 2% → 降仓50%
- 波动率控制: 年化 > 20% → 减仓
- 最大回撤: > 15% → 全面风控
第八章 批判性反思
8.1 量化的局限
- 数据依赖 - 过去的数据 ≠ 未来的规律
- 过拟合陷阱 - 回测完美 ≠ 实盘盈利
- 流动性约束 - 小市值策略无法放大
- 模型风险 - 2020年3月,量化基金集体回撤
8.2 量化的真正价值
不是”稳赚”,而是:
- 纪律性 - 克服情绪弱点
- 可复制性 - 策略可以规模化
- 可解释性 - 知道为什么赚钱/亏钱
- 可迭代 - 不断适应市场
8.3 主观 vs 量化:一个伪命题
“量化本质上是统计套利,是统计过往的规律。市场是在变化的,如果下一年和过往完全不同,它肯定有一段时间就糊涂了。” — 郭学文 (茂源资本)
主观和量化的区别不在于”谁更好”,而在于:
- 主观:依赖个人判断,决策快,但受情绪影响
- 量化:依赖模型纪律,系统性强,但需要迭代
未来的趋势是融合:
“七分量化,三分主观。” — 盛丰衍 (西部利得基金)
结语:谦卑与进取
量化投资的本质,是一个哲学问题:
这个世界可以被数学描述吗?
如果可以 → 量化是终极答案 如果不可以 → 量化只是一个阶段性工具
索普用了60年证明了一件事:
市场可以部分被预测,但永远不会被完全征服。
这或许就是量化的终极领悟:
谦卑地承认不确定性,是量化最大的确定。
但正是这种”知道不能完全征服”的谦卑,让量化投资者不断前行——
因为每一次模型的失效,都是下一次进步的起点。
附录一:关键年份
| 年份 | 事件 |
|---|---|
| 1900 | 巴舍利耶随机游走理论 |
| 1956 | 凯利公式诞生 |
| 1962 | 索普《战胜庄家》出版 |
| 1967 | 索普进入华尔街 |
| 1973 | Black-Scholes模型 |
| 1977 | 文艺复兴科技成立 |
| 1987 | 黑色星期一 |
| 1989 | 大奖章基金启动 |
| 1998 | LTCM崩溃 |
| 2010 | 沪深300期货推出 |
| 2015 | 中国量化爆发/股灾 |
| 2016 | 幻方All in AI |
| 2023 | DeepSeek进军AGI |
附录二:进阶书单
数学/统计:
- 《概率论与数理统计》
- 《随机过程》- Shreve
- 《金融工程》- Hull
量化投资:
- 《主动投资组合管理》- Grinold
- 《Quantitative Trading》- Chan
因子投资:
- 《因子投资》- Rivera
本文版本:2026-03-06 参考资料:兴业证券报告、凤凰网、有知有行、雪球等