《打开量化投资的黑箱(原书第2版)》是一本介绍量化投资的经典著作。作者深入浅出地解释了量化投资的原理和方法,让读者能够了解如何运用数据和算法进行投资决策。通过阅读本书,读者可以更好地理解量化投资的黑箱,从而提高投资的成功率。
打开量化投资的黑箱(原书第2版)读后感(一)
不错的入门书籍,讲了大致的量化框架,但是很少涉及具体的策略,一些想法值得借鉴。能够让人很快入门但是最好自己去实践一下,能够理解量化究竟是怎样的一件事情。
看完这本书需要补充一些具体的策略,感觉量化拼的就是细节。
我要吐槽一下,为啥规定要140个字,这是我第一次写书评,简直可怕,啊啊啊啊
打开量化投资的黑箱(原书第2版)读后感(二)
量化工具零零星星有用,想看看专业书籍怎么写的,KINDLE看的,前半部分读的比较仔细,高频基本略过了。
对专业名词的扫盲比较有用,比如真正的阿尔法应该怎么理解?做市商是干什么的?数据清洗是什么?但总体来说关于策略和风险相关东西只是泛泛而谈,和平时做交易的常识基本相同。比较适合当教科书收藏吧,对一些概念的分类梳理的不错,值得记一记。
打开量化投资的黑箱(原书第2版)读后感(三)
书的内容非常好,对于量化入门者来说足够理解这个领域的复杂性(而不是机会)。
作者的领域知识非常不错,结构清楚、细节饱满、知识覆盖度足够广,这方面我给9分(对入门来说)。 作者的写作能力实在不怎么样,经常突然冒出来“第三种 XXXX” 或者 前面说了三种,只找到两种这一节就完了。所以,这方面只能给个7分,勉强及格吧。 翻译太差,给5分,连及格都算不上。看了一下译者,都是证券机构的高材生,而且是3个人!难怪同一个概念前后两章有如此大的差异,我想问,连错别字都层出不穷,你们的博士白读了?大部分无法理解的概念都源于翻译导致,所以,还是去读英文版吧。
相比一些其他类似的入门书,这本书最大的好处是有中文版。 其实国外量化的入门书无论从结构还是内容上都差不多,也没有太多的专有名词,还是比较好读的。 阅读本书,你需要具备一定的统计学知识,还需要随时查询金融词汇(如果不是金融专业)。另外,最好还有一些机器学习方面的经验,因为量化交易中的模型都需要训练、评估,所以这本书的前几张核心部分,超过1/3左右的内容都是和机器学习直接相关的。可以看出作者并不是机器学习方面的专家,所以解释相关概念和方法时并不专业,但这些概念和方法确实在被使用。
没读过第一版,但是这书能出第二版,完全是因为宽客这个群体太小,国内没有更好的入门中文书!
打开量化投资的黑箱(原书第2版)读后感(四)
#打开量化投资的黑箱# 这本书是Rishi K.Narang所写的,很适合入门,有助于形成一个相对更为系统性的框架。而且在语言描述上偏向于通俗易懂,深入浅出的方式为你介绍了量化投资的箱子里到底装了什么东西。不过也有缺陷,翻译上存在的问题吧,前后翻译出现的不一致的现象,以及高频交易这一块,写的很乱,让我没有耐心仔细读。 书的内容不多,但是为我们展现出了量化投资的整体框架,逻辑性强,有条理,阅读起来体验良好。文章是一个循序渐进的过程,一步一步为我们揭开量化投资的面纱。 整本书分为四个部分:量化交易是什么?量化交易是怎么做的?怎么评价量化交易?以及高速和高频交易。量化交易的简介是对名词的扫盲,怎么做的过程介绍有助于我们了解QUANT到底在做什么。 首先来介绍一下第一部分,量化交易就是建仓的点位选择和头寸规模大小均由系统参数。QUANT的日常就是产生想法,测试想法,进行决策。 交易系统中包含有3个模块:阿尔法模型,风险模型和交易成本模型。 阿尔法模型是,为了增加盈利,在投资过程中所使用的一系列技巧或策略。阿尔法模型分为两类,理论驱动型和数据驱动型。理论驱动型可分为基于价格数据和基于基本面数据的。基于价格数据的有趋势性、均值回复型、技术情绪型;基于基本面的有价值性、成长性、品质型。 趋势跟随策略是基于以下基本假定,在一定时间内市场通常是朝着同一方向变化。据此对市场趋势做出判断就可以作为制定交易策略的依据。均值回复策略,价格围绕其价值中枢上下波动,因此价格终究会沿着已有趋势的反方向运动,而不可能一直延续已有趋势。技术情绪型策略,主要通过追踪投资者相关指标来预判回报,指标有交易价格、交易量以及波动率指标。 价值型认为市场倾向于高估高风险资产的风险,低估低风险资产的风险,因此在恰当时机买入高风险,卖出低风险,获取利差,这个利差也就是安全边际。成长型则是考虑资产以往的增长水平,对未来趋势进行判断。买入价格上涨,卖出价格涨幅较慢甚至负增长的产品。在这里成长型的思想是建议我们尽早判断公司股价处于增长期,从而捕捉到公司股价未来更大的上涨幅度。品质型则是买入高品质资产而做空低品质资产。看中的是资金的安全。 数据驱动下阿尔法模型,借助一定分析工具通过某种可识别的模式,由数据告诉你未来会发生的事情。进入门槛高,竞争对手少,但策略需要经常性调整,而调整也有很大风险。 一套实施策略所包含的方面:预测目标、投资期限、投资结构、投资范围、模型设定和运行频率。混合阿尔法策略里边包含有三种最常用的量化方法分别是线性模型、非线性模型和机器学习模型。 风险模型主要是讲如何定义、度量以及控制风险。侧重点在于如何风控,包含硬性约束和惩罚函数。 交易成本模型中,首先是介绍交易成本包含佣金和费用、滑点和市场冲击成本。常见的交易成本模型有常值型交易成本、线性交易成本模型、分段线性交易成本模型、二次型交易成本模型。 接下来是投资组合构建,主要描述了两大类模型。基于规则的模型:相同头寸加权、相等风险加权、阿尔法驱动型加权;基于组合最优化模型:优化工具输入变量、优化技术、再输出理想头寸以及各个头寸的规模。
打开量化投资的黑箱(原书第2版)读后感(五)
作为华尔街顶级数量金融专家、资深对冲基金经理,毕业于加州伯克利的他对于金融市场的运转、风险以及过往的经验教训都有非常成熟和系统的见解。本书的案例和术语难度适中,翻译也非常好,一些细节的案例,如1998年,2007年经济危机过程的描述清晰,让人印象深刻。
书中首先引入了“有效市场 efficient market”的概念。金融市场的有效性指市场的供需平衡下决定的价值与价格匹配,在这种情况下,市场上不会存在无风险套利机会。当市场存在其他交易者的时候,市场会由于供需关系短暂不平衡,而出现短暂的套利机会。任何金融交易,包括量化交易,并不是能够绝对消除市场无效性并获利,而是承担了损失风险概率性的获利。
宽客区别于主观性交易者,都是在通过人为的经验进行算发性的交易操作。区别在于有些经验难以为算法所描述,只能称为一种“老道的直觉”。宽客存在实际上是借助了现代信息化工具,自动化地进行金融资产的分析与买卖。正因为宽客推动人经验的算法化,因此宽客实际上对于一些经验需要有更为深入的理解,同时需要明白算法的不同部分在各种突发市场情况下表现得原因,以期能够分析和避免错误操作,造成无法预期得损失。
本书将量化交易决策的结构规整化为“阿尔法模型”,“风险模型”,“交易成本模型”,“投资组合构建模型”,“执行模型”五部分。并在介绍了量化模型后,进而讨论了量化交易的利与弊,案例丰富、语言形象。最后简单介绍了高频交易以及整个交易网络,作为高频交易的引子。
阿尔法模型是一种对于资产的预测收益,基于经济学的理论,阿尔法因子表达的收益是一种扣除市场因素后的额外收益。
理论驱动型阿尔法模型
【趋势跟随型】:基本原理为“市场均衡理论”。认为市场的波动是从一个均衡点到另一个均衡点的过程,趋势跟随投资者承担的是未来一定时间内趋势不会继续保持的风险。该策略的对立观点是“博傻理论”,趋势被人相信才会继续保持,最后一个相信市场趋势还会继续的人称为整个泡沫最后的持有者。
【均值回复型】:认为产品的价值应该是稳定的,价格围绕价值上下波动,这种波动性来源于市场偶然出现超买或者超卖的流动性,短期不平衡带来金融资产价格的波动。最为经典的均值回复性策略为“统计套利策略”,认为业务相似的公司应该具有相对稳定的股价,因此比较相似的公司判断另一家公司是被低估还是高估了。
【技术情绪型】:1)通过观察期权市场判断基本情绪。观察认购量和认沽量判断;观察认购和认沽的隐含波动率判断。2)分析交易量、公开市场利率或其他指标预测未来价格。常用的数据来自“限价指令簿”,一种等待交易的被动交易订单。
【价值收益型】:通过市盈率、股息收益率判断公司的价值。市场通常倾向于高估高风险资产的风险,而低估低风险资产的风险。因此适当买入高风险资产或者卖出低风险资产,可以获得收益。实际收益高于基本面数据的预期收益的企业,价值可能已经偏离价格逐渐走高。对于这些价格变低的金融产品,价值型投资者实际承担了价格趋势会继续的风险。高风险与高收益总是并存的。货币与期货市场往往比股票市场对此理解得更加深刻。对大多数价值型投资者都是在寻找相对价值较低的股票。
【成长型】:成长型策略往往需要基于以往的资产以及地区政策等因素判断未来公司的走势。同时必须尽早地判断出来,否则等待股价开始上涨,即代表市场的绝大多数人已经发现了该公司的成长价值。宏观层面可以看到,一些外汇交易者的策略往往是“持有经济快速增长的国家的外汇”。
【品质型】:该类策略的基本理念是看重资产的安全性。着眼持有高品质资产的投资策略有助于保护投资者,尤其在高风险的市场环境下,也被称为“安全投资转移策略flight to quality”。常见分析:1)杠杆比率;2)收入来源多样性,分析收入的波动率;3)管理水品,分析操纵性应计利润的变化;4)欺诈风险,分析量化股票多空策略中的收益质量,如真实收益与公布的每股净收益的接近程度;5)对公司或者所属国家的情绪预测,分析新用违约互换市场、波动率等判断市场投资者的信心。品质型策略往往收益周期长,并且对与宏观市场环境依赖较大,在2008年的信贷危机中,品质型策略在预测银行股相对价格中大放异彩。
数据驱动型阿尔法模型
数据驱动型阿尔法模型通过将模型在过往数据上回测,学习历史数据调整参数。根据预测目标划分有“方向”和“振幅”,根据投资期限划分有“高频”、“短线”、“中线”和“长线”,根据投注结构有“绝对型”和“相对型”,根据资产类型有“股票”、“债券”、“货币”和“商品”。数据驱动行阿尔法模型由于参数是通过数据学习的,所以学习的数据范围,如时间段、时间精度等,以及各种有哪些处理后的数据,如一段时间内的滑动平均、市盈率、杠杆率、公开市场利率等,都非常重要;同时学习的参数,如头寸的把握,持仓的时刻,持有资产的周期,执行交易的频率,意外条件变量的警告值等都需要细细考虑。
阿尔法模型从一堆资产中挑出了一堆有投资价值的资产,对这些资产进行投资即代表了一种收益敞口;同时,收益总是伴随风险。任何资产投资活动绝不仅是追求最大的收益,更要规避风险的发生并控制可能风险的规模在可承受的范围下。
规模风险可以通过在硬性约束和惩罚函数两种方式进行控制;投资金融产品和组合风险的预测通过单个金融资产纵向波动率分析,以及组合内不同金融产品的相关系数来表征,根据概率学原理,当投资组合内的资产都不相关时,才能最大可能避免一些系统性的风险。风险模型常用的一个工具是VaR(Value at risk),基于波动率水平计算投资组合的单日标准差。
风险模型除了以上考虑单个金融资产的规模,有时也要考虑整个行业板块和金融市场环境的风险。因此除了分析单个金融产品或者组合的风险,更为可靠的应该分析行业和市场的波动率和风险。
交易成本模型是对于交易不可避免的成本进行分析。由于阿尔法模型只能获得收益,但是如果要执行该笔交易还需要判断收益是否大于成本。
交易成本来源于三个点:1)佣金与费用,2)滑点,3)市场冲击成本。滑点来自交易完成周期过程中,市场的自然走势。市场冲击主要受订单规模影响。大规模市场订单会造成市场其他投资者发现机会带动价格朝不利于订单方向移动。由此引入了“暗池交易”的概念,暗池交易并不是近期市场才出现的,早在西方交易所成立之始,为了整理尚未完成的被动订单,同时确认不同订单的优先级而存在的“限价指令簿”之外,交易者可以选择主动降低优先级,而不公开大额订单,从而减少对于市场的冲击。
投资组合构建模型是在阿尔法收益模型、风险模型和交易成本模型的基础上,规划交易的执行订单。确定为哪些资产,持有什么以及多少头寸。常见的类型有四类:相等头寸夹权,相等风险加权,阿尔法驱动型加权以及决策树夹权。
该章节提出了一个非常有意思的工具是,1990年诺贝尔经济学奖获得者哈里·马科维茨在《投资组合选择》中提出的“均值方差优化技术”,旨在通过在一揽子待投资的组合中,根据不同资产的均值、方差、期望相关系数矩阵决定不同风险水平下的一系列投资组合。意在直观的通过确定不同风险,得到不同的组合方式。马科维茨之后,其他经典的优化方法有,
布莱克·利特曼方法,将输入数据的置信度引入。适用于帮助宽客引入主观对于市场行情的判断。
格里诺德·卡恩方法,将多个投资组合的判断进行综合,平衡不同策略之间的计算结果。
理查德·米肖重新采样方法,通过蒙特卡洛模拟对数据进行重新采样,以期得到不同假设情况下,策略表现好与坏的概率,以及好与坏的程度。
执行模型是整个交易过程的最后环节。执行策略的失败可能导致前面所有预测和风险控制的努力付诸东流。订单执行模型的主要目的是以经可能低的价格,尽可能完整地完成想要交易地订单。
订单执行涉及订单地进取性讨论,订单的进取性越强、时间越靠前优先进行交易。订单的进取性随着对价格议价权、市场公开与否的放弃而下降。
本章最后探讨了交易基础设施对于硬件、延迟等指标的敏感性。引入了高频交易对于硬件依赖的重要性。
有了以上这么一套关于量化交易系统的基本模型,以及各个模型的目标、策略和相应的实现分类,基本对于一个量化模型有了一个简单的认识。但很遗憾的是,尽管有了这些概念,让我立即设计一个哪怕盈利能力很差的模型,我都很难保证自己可以做到。原因在于,随着后面的阅读,我逐渐认识到了两个问题:1)量化交易市场的风险与策略设计的难度,2)量化交易模型在市场上实际拿到订单的难度。
由于模型总是在过去的数据上回测,因此如何确定模型对于历史的拟合依然能够在未来的数据上获利本身谁都没有十足的把握。尤其在了解了各种围观和宏观经济分析后。比如通过VaR工具,或者引入板块风险、产品相关度、置信度等因素后,获得预测波动率,然后预测收益与风险敞口。作为一个新人,很难完全将模型交给数据,而没有任何理论支撑。那样一个模型只能说对于数据拟合比较好,很难在新的市场波动下成功。
结构关系变化风险
结构关系风险,进一步解释了上面为何对于完全基于数据拟合而没有理论基础是行不通的。我们通常会用股票数据之间的相关性进行风险约束以及评估。但是这种相关性是会变化的,而且在不同的市场信号发出时,未来的变动方向完全是投资者能够判断,而模型不一定习得(也很难习得的)。因此这种市场模型下,模型是很脆弱的。
外生冲击风险
外生冲击风险由市场外的信息驱动,如恐怖袭击、战争或者政治干涉等。量化模型使用市场数据进行预测,当非市场信息对价格产生影响,量化策略就会受到影响。这种风险带动了整个板块或者市场行情的变化。
蔓延风险和同质投资者风险
由于量化交易本身自动化程度高,算法设计核心思路相似。故当市场出现某种机端信号,很容易被多家量化公司识别,从而产生取款机效应。取款机效应发生核心是由于发生流动性危机,市场或者公司突然统一策略,最终加重流动性危机的。比较代表的是1998年,长期资本管理公司基于“双重上市及并购股价趋于一致”。在皇家壳牌公司合并案中,长期资本做多壳牌,做空皇家,套入大量现金,最后由于俄罗斯债务违约直接导致长期资本流动性不足无法忍受持续扩大的多空差,被迫破产。另一个案件时2007年8月,许多量化基金损失严重。主要原因在于,2007年8月前一段时间,原有策略表现不佳,很多量化基金策略趋同化,同时由于交叉抵押杠杆过大,VaR风险控制工具的使用泛滥,共同导致市场发生取款机效应,发生流动性危机。
打开量化投资的黑箱(原书第2版)读后感(六)
量化策略的扫盲书,是可以学到东西的那种。前半部分说得很详细,其实对比目前国内的情况,和成书时的美国类似。正适合像我这种连滑点具体指啥也不清楚的人....
量化投资,简而言之是一个方法和决策的过程。在策略形成之前,运用人工来开发,策略大概形成后,做回测和拟合,再编程运用到实盘,在执行交易的时候,采用算法交易,运用程序下单。从决策的产生到实施的过程都采用计算机,不做人工干预。
相对于一般多头组合,量化投资除了策略即阿尔法模型之外,还包括两个非常重要的系统模块,交易模块以及风险模块。全书中很系统地进行了一一梳理。
在阿尔法层面,很多耳熟能详的策略,动量、反转、基本面、情绪。这些书里都有写到。
另外,针对当下最热的机器学习,作者也给了可以参考便于理解的解释。机器学习的最大好处,是对组合类的阿尔法模型进行优化,提高精度。因为其非线型的方式,因此在不断变化的市场中能够快速做出反应,自我加强学习,并提供与当下形势更匹配的策略仓单。
例如2017年后半年市场呈现出一九风格的价值股构行情,假如采用的是多因子选股的模式,就需要人工识别并做出手工调整,可是机器学习就可以利用新进入的数据进行自我的调整,从而达到适应整个市场。
在完成阿尔法模块之后,进入到风险模块。在这个环节,宽客需要做的是设立止损、选择敞口。对比阿尔法的话,阿尔法可以理解为冒了风险能够取得的收益,是一个预测值。而风险对于宽客来说,更多意味着是否值得去冒风险,具体是敞口和规模的决策。对风险的思维,早已经植根在量化投资的内里。对他们而言更关键的是如何利用风险,管理风险。
另一个值得说的是最大回撤。作者对于最大回撤的理解是一个有偏统计量。因为针对量化投资,收益风险是涵盖在决策模型内的,因此,最大回撤好比一副纸牌,如果顺序打乱,这个数据可能就大不相同。但另一方面,作者同时又指出,投资不同于凯利公式,量化的每次操作决定并非一个完全独立的动作,因此这个解读有对有错,还得具体分析。
最后,在交易执行层面,对于量化,这个部分更加重要。很多时候我们看到的有效策略,在经受佣金、滑点、冲击成本之后,便不复存在。所以如何控制交易成本在量化投资中至关重要。所以衍生到策略容量的大小,衍生到为什么有很多大牌量化私募将自己的服务器搬至交易所附近,等等。
正如“你用因子,他也用因子;你没赚钱,他却赚钱了”,有些因子之所以成功,关键就是实践中必须考虑的各种细节。好比数据的清洗,好比敞口以及头寸的大小,好比交易执行中的算法、冲击成本滑点的缩减等等。
市场的非有效性确保因子持续有效。而因子投资的关键则是执行时对各种细节的精确处理。所谓阿尔法的手艺,只有那些专注于做好每个细节的优秀基金经理才能把因子投资在理论上的超额收益转换成现实。
1、对于高频交易具有更高的目标,希望复制那些在交易日每小时甚至是在每分钟都能够获利的交易策略。
2、量化交易策略本质上是一种决策过程。
3、宽客之所以被称为宽客,就在于他们会刻苦钻研交易策略的产生和实施过程。至于交易策略本身,宽客和主观判断型交易者并没有什么差别。
4、如果建仓的点位选择及头寸的规模大小都是系统自动生成的,则是量化交易。
5、量化交易系统包括3个模块:阿尔法模型、风险模型、交易成本模型
6、风险模型旨在帮助宽客控制不太可能带来收益但会造成损失的敞口规模。
7、对于所有阿尔法模型而言,如果能带来盈利,那么所承担的风险便是值得的,否则便没有丝毫价值。
8、科学的两个重要分支是理论主义和经验主义。理论型科学与经验型科学的区别直接导致了两种类型的交易策略。
第一种,也是目前为止最常见的,是理论驱动型。他们通过观察市场行为,寻找可能用来解释这些行为的普适性理论,再依据市场数据来检验该理论是否可以有效解释市场行为。
第二中通过合理使用正确的技术性手段,人们可以识别出隐藏的数据中的模式或规律。经验型科学家宁愿花费很大精力去发掘隐藏在数据中的繁杂的各种关系模式,也不愿总结一套理论去对数据进行统一的解释。
9、绝大多数理论驱动型交易策略可以较为容易地划分为六类:
价格:趋势型、回复型(回归)、技术情绪型;
基本面:价值收益型、成长型和品质型。
10、理解一个交易策略所使用的数据比理解策略本身更加重要。
11、基于价格数据的阿尔法模型,试图预测价格并从中获利。通常分析以下两种现象之一:一是已有趋势是否延续,二是目前的趋势是否反转。
12、成功的趋势跟随者冒着资产净值减少1%的粉线换来的收益达不到1%。换言之,为了得到50%的年华收益率,投资者要做好可能至少损失50%的风险准备。简言之,趋势跟随策略的收益极其不稳定。
13、主流阿尔法模型,都可能存在长期低回报的现象。因为交易策略试图寻找的市场机会并不是综存在的,而是具有不稳定性和偶发性。
14、有趣的是,趋势跟随策略和均值回复策略并不一定是相互冲突的。趋势通常是长期的,而短期内围绕着趋势的小范围波动也是很常见的。
15、显然在完全相同的时间段内,这两个截然相反的策略不可能同时获利。但是我们并不需要在同一投资期限内构建两个策略。趋势通常在较长的投资期限上延续,而均值回归通常适用于短期投资期限。
16、技术情绪型策略,通过追踪投资者情绪相关指标来判断预期回报,常见指标有交易价格、交易量以及波动性指标等。
17、价值型投资策略认为,市场倾向于高估高风险资产的风险,而低估低风险资产的风险。因此在适当时间买入高风险资产和卖出低风险资产,可以获得收益。
18、市场情绪策略:依赖于市场分析师或经济学家的观点。
19、很多高频交易者喜欢使用纯粹经验主义的数据挖掘的方法去设计其短期交易策略。
20、在高频交易的时间尺度上数据资源非常丰富。
21、数据挖掘型需要的算法计算量可能大到无法实现。例如要对两年的盘中实时数据进行较为全面的搜索去寻找具有一定预测能力的指标,即便涉及的变量只有少数几个,使用一台电脑连续工作也得需要3个月。
22、分钟策略和小时策略间收益的差异要大于3月期策略和6月期策略间收益的差别。
23、高频交易策略是最快的,预测期限不超过当前交易日。第二类是短线交易策略,倾向于持仓一天到两周。中线策略预测的期限是几周到几个月。长线策略通常是持仓几个月或更长时间。
24、机器学习方法可用于判断量化交易模型中参数的最优设定。机器学习类算法旨在提供一种理论上可行的智能化途径,在不出现过度拟合的前提下去测试参数的许多潜在组合以选择最优组合。
25、重拟合也可能导致出现过度拟合的风险。过度拟合也是个很危险的问题,会导致一些虚假的、短暂的关系被错认为是有效的、具有持续性的。
26、停止规则有很多种:止损、止盈和时间停止。
27、非线性模型假设:用于预测目的的变量之间是不独立的或变量间的关系是随时间变化的。两类主要的非线型模型是条件模型、旋转模型。条件模型赋予某一阿尔法模型的权重,取决于该模型对其他模型的解释能力。旋转模型根据阿尔法模型的表现追随相应的趋势,而不是跟随市场本身的趋势。
28、随着时间的推进,越来越多近期的数据被用来计算权重,以期模型的权重与当前的市场形势更加相关。
29、机器学习方法在混合阿尔法模型中的使用更为常见,效果也更好。这些方法是用算法来计算出能对历史数据具有最强解释能力的最优混合。
30、长期看,风险敞口不会带来利润,但他们随时对策略的收益造成影响。宽客并不会试图去预测这些敞口,通常因为无法成功地对此进行预测。量化交易的一个强大功能在于能对各种敞口进行度量和有目的地选择。
31、控制规模的方法有两大类:硬性约束和惩罚。
硬性约束就是设定风险线。例如强行规定头寸规模不能超过投资组合的3%,无论信号多强烈。但这类硬性限制可能有些武断(3%和3.01%的区别?)所以有时宽客使用惩罚函数的方法,只有在阿尔法模型带来的收益显著增大的情况下才允许仓位超过临界水平。
32、惩罚函数具有这样的特征:仓位超出临界水平越多,增加仓位越困难。
33、风险控制模型以这种方式阐述一个观点:有时候机会好到足以值得打破规矩。
34、凯利准则的反对者指出,该准则的一个重要假设是每一次投注之间相互独立,这在很多赌博场景下是成立的。但是在进行投资时,投注通常是相互关联的,从而投资策略的收益并不均匀。
35、风险管理通常被误认为是降低风险的操作流程,实际上是在给定的风险水平下通过选择敞口并控制其规模而最大化收益。
36、风险管理中的量化方法,通过判断并度量哪种敞口在驱动投资组合,使基金经理可以据此做出理性而慎重的决策。
37、在量化交易届,进行交易只有两个原因:第一,可以增加盈利的概率或量(比如阿尔法模型);
第二,可以降低亏损的概率或量(例如风险模型)。
38、交易成本主要有三部分构成:佣金和费用、滑点(slippage)、市场冲击成本。
39、滑点是指从交易者决定开始交易到订单进入交易所系统时间被执行这两个时间段所发生的价格变动。
40、在对不同产品的交易成本进行估计时,很多宽客对其投资组合中每一种产品使用单独的模型,并且给予交易系统所收集的数据允许模型随着时间变化。换句话,很多交易成本模型高度依赖历史经验,在观察到的、记录下来的交易数据的基础上允许模型随着时间进行变化。
41、宽客们普遍认为这条曲线应该是二次型,这意味着随着交易规模增大(由于市场冲击),交易成本上升的速度会更快。
42、二次成本函数本质上还是过于复杂。
43、线性交易成本模型需要在规模较小的情况下高估交易成本和在规模较大的情况下低估交易成本之间进行权衡。
44、阿尔法模型并不是创造收益而是进行预测并将这些预测传递给投资组合构建模型。
45、基于规则的投资组合构建模型有4类:
相等头寸加权、相等风险加权、阿尔法驱动型加权、决策树加权。
46、使用等权重模型是因为他们注意到了非等权重加权方法的很多缺陷。它总是默认模型具有统计学意义上的能力和功效,对头寸方向、波动幅度和向相对于投资组合中其他预测值变动的概率进行准确的预测。
47、在趋势的峰值处得到最强信号所承担的正是趋势可能会反转的风险。
48、均值方差优化方法是一种数据挖掘类方法,通过在各种可能的投资组合中进行搜索,寻找表现出最好特征的一类。机器学习领域差不多也在做基本相同的事。
49、量化投资组合构建模型的输出变量是目标投资组合:理想的头寸以及各个头寸的规模。将目标投资组合与现有投资组合进行比较,二者间的差距就是需要进行的交易。
50、使用基于规则的权重分配系统的绝大部分宽客貌似都采用“绝对型的”阿尔法方法。绝大部分是从事期货交易。而使用优化工具的宽客倾向专注于“相对”阿尔法方法。
51、执行算法对于订单运行更加可靠。执行算法包括完成订单的逻辑结构,含有为了尽可能减少市场冲击如何将大订单拆分成小订单的说明,还有应对限价指令簿和价格变化的各种措施。
52、如果一个订单执行算法有明显的印迹,其他市场参与者就可以预测其行为,这些参与者有可能会进行同样的操作,从而加重了该算法所导致的市场冲击和滑点。
53、订单的进取程度通常取决于所选用交易策略的类型,也依赖于信号强度以及系统关于信号的置信水平。
54、高频策略的分析师,使用的连接方式——主机托管。经纪商通过DMA平台向交易者提供市场接口,但这个过程存在一定程度的延迟。对延迟效应敏感的量化策略可以选择主机托管方式来改进连接速度。在主机托管过程中,交易者试图将交易服务器的物理地址尽可能地靠近交易所。很多情况下,这意味主服务器和交易所的服务器出于同样的数据中性。这种地理位置上的接近,主要是为了尽可能地缩短订单(以光速进行)传输的距离(从交易者的服务器到交易所)。
55、我们关注一个统计量:块度。指的是显著高于平均收益的时间段内的收益占策略总收益的比例。
56、最大回撤仅仅是一个有偏样本产生的可能结果。想想历史收益分布像一副纸牌。如果我们按照纸牌的原有顺序翻转纸牌,将得到历史时间序列。然而如果重新洗牌,按照新的顺序翻转纸牌,将得到不同的时间序列。
57、尽调宽客:每三个月询问一次,他所进行的研究课题是什么,过去的3个月他对模型增加了什么内容,随着时间推移,你应该能看到一个合理的生命周期,表现出重复稳健的研究思路和不断被改进的策略。
58、建议问宽客的问题:
(1)研究和发展策略。
如何提出新的交易策略想法?
对这些想法如何进行测试?
样本内测试和样本外测试的方法是?
策略是否有有效的判断依据?
(2)数据搜寻、收集、清洗、管理。
使用什么数据?
如何清洗数据?
(3)投资选择和构造。
你能描述阿尔法背后的理论吗?
你的阿尔法策略适用的投资期限多长?
你如何组合不同的阿尔法模型?
(4)投资组合构建。
如何确定头寸大小?
是否有头寸限制?原因是?
(5)执行。
用哪一种交易成本模型?
如何执行交易?人工还是自动化?
(6)风险管理和监测。
风险模型考虑因素有哪些?
不同的风险限额是?
什么情况下会干预自己的模型?
59、对于理解优势和优势的持续性,宽客如何处理灾难是至关重要的。
60、投资者必须理解所执行的策略、策略特征以及策略产生过程的活力状态。
61、投资者必须判断宽客是否有优势,优势根源是什么,优势可以支撑多长时间,未来会面临什么威胁。
最后,打个广告,关于2018上半年国内量化私募的表现,在微信号(ID:Smart-Asset,SmartAsset小枣堂)写了一篇文章,欢迎关注指教。