围棋棋手

机器学习:从围棋、扑克到投资发布时间:2019-08-29

  2016年,AlphaGo横扫围棋界。AlphaGo在60局中连胜数十位中日韩围棋高手,在打败了中国排名第一的职业棋手柯洁后,被柯洁称赞近乎是“围棋界的上帝”。

  2017年,Libratus(冷扑大师)进军德扑对战。这是一款由卡耐基梅隆大学(CMU)学者开发的AI程序。在宾夕法尼亚州匹兹堡的赌场持续进行了20天的1对1无限制德扑比赛后,它成功战胜了4名全球顶级职业玩家。

  2019年7月,在冷扑大师的基础上,CMU与Facebook AI共同开发出了Pluribus。这款新的程序实现了前辈未完成的任务——在6人无限制玩法中成功击败5位专家级人类玩家。

  Pluribus的成功表明,尽管理论上没法保证AI在多人游戏中的表现,但通过精巧的算法依然有望设计和训练出超越人类的AI。

  这力量就是机器学习。它是人工智能范畴下的一种重要方法,是实现人工智能的一种途径。

  通俗来说,人工智能(Artificial Intelligence)目的就是使机器具备部分(甚至是全部)人类的智能,我们可以根据其智能的程度分为响应式机器、有限记忆机器,心智理论机器和自我意识机器四类。其中,AlphaGo可以归类为有限记忆机器,这意味着机器可以根据过去有限的经验来决定未来的步骤。

  1、高效性:在机器学习的算法中,机器的使用者只需要提供过去发生的样本数据,算法就能够通过过去相关事件的数据自己总结出相关模型,再基于模型对新的事件进行判断。样本量越大,机器决策的正确性就越高。而传统算法需要使用者将已有知识传输给机器。相比之下,机器能够24小时不间断地分析样本,大大提高了效率。

  2、普适性:用传统算法去解决一个问题,条件发生变化时代码可能就需要调整,这带来很高的改进成本。而用机器学习,只需要调整输入的样本数据就能让机器自己分析出新的模型。这一特性使得机器学习能够适用于各个能够获得大量数据的行业,大大增强了机器的普适性。

  最近十年,机器学习的发展与应用成果有了突飞猛进的进步。如今机器学习在各个行业获得成功应用主要归功于三个方面:数据、算法和算力。

  1、数据是机器学习准确性的保障。机器学习系统对于原始数据样本的数量和质量都有较高的要求。对于一个具体的事件,开发者需要收集大量可靠的历史数据。但并不是所有事件都能收集到所要求的数据。特别是在工业领域,一些尖端工艺并不存在相对应的历史数据。而在另一些领域(比如金融),相对完备的历史数据可以支撑AI优先落地。

  2、算法是机器学习的核心。在机器学习的发展史中出现过各种不同方向的算法,其中使用最多、影响最广、最典型的算法主要包括六种:回归算法、神经网络算法、SVM、聚类算法、降维算法、推荐算法。随着深度学习算法的提出,神经网络算法成为了近期的热点,AlphaGo和众多自动驾驶平台都采用了此种算法。

  3、算力的提升使得更多算法得以实现。随着计算机处理速度和存储能力的不断提升,机器学习得以继续发展。GPU(图形处理器)与CPU类似,只不过GPU是专为执行复杂的数学和几何计算而设计的。以深度学习为例,深度学习中一类成功应用的技术叫做卷积神经网络CNN,这种网络在数学上就是许多卷积运算和矩阵运算的组合,而卷积运算通过一定的数学手段也可以通过矩阵运算完成。GPU最擅长的是图形点的矩阵运算,因此深度学习能够非常恰当地运用GPU进行加速。

  近年来,在学术界和企业界的共同推动下,数据量和算力都有了很大的提高,算法也小有突破。而在谷歌、亚马逊、IBM、微软、阿里巴巴等技术巨头的推动下,高效又便宜的算力也变得越来越容易获得。在这种背景下,机器学习在各个行业的应用前景更多的则是取决于数据在该行业的积累。

  李开复在他的著作《人工智能》里说,“金融行业是AI(人工智能)目前最被看好的落地领域。机器学习将会被用来模拟、识别、分析、自动化、预测、高频交易”;“未来五年,算法——量化交易策略将会取代人类,主宰资产管理领域”。其理由包括:与其他垂直行业相比,金融是全球大数据积累最好的行业;银行、保险、证券等产业本身业务就是基于大量数据和统计来开展的;金融行业也非常注重数据的规范化、采集自动化、存贮、集中和共享。

  各大投行在机器学习领域的布局包括搭建机器学习实验室及策略开发实验室。早在2010年,摩根斯坦利就组建了由Ambika Sukla带队的“摩根斯坦利机器学习实验室”。2014年,机器学习和金融专家Juan-Luis Perez在瑞银组建“证据(Evidence)实验室”。2017年,瑞信前Capital One数据科学团队主管Jacob Sisk领导建立“CS实验室”。到了2018年,摩根大通、瑞银、巴克莱相继组建了偏策略开发的机器学习团队。

  具体到金融产品领域,头部投行先后推出了基于机器学习的金融服务,用智能算法替代传统的人工业务。比如摩根大通2017年开发了一款金融合同解析软件COIN,可以在几秒钟内完成之前律师和贷款人员需要360000小时才能完成的工作,且错误率大大降低。又比如瑞银发布了一个机器学习系统,可以自动处理客户的建仓请求邮件和调仓请求邮件,将该工作时间从45分钟缩短至2分钟,大大提高了工作效率。

  在投资领域,目前机器学习技术已在算法交易、风险分析等方面得到了一定的应用。此外,各大投行、对冲基金、大学研究机构一直在尝试在决策环节使用机器学习。比如德意志银行在2017年底公开宣布的机器学习交易平台Autobahn 2.0,就能够实时预测股票价格、交易量和动量(momentum),并依据变化调整交易策略。海外该领域相对领先的机构包括BridgeWater、Jane Street、WealthFront、Betterment等。

  摩根大通的一份报告表明,不同的机器学习方法适用于不同的目的。监督学习可以被用于趋势预测。例如,如果通货膨胀速度加快,它可能会判断下一步市场的走向。而无监督学习将被用于识别大量变量之间的关系。例如它可以包含历史数据中高低波动性、经济上升和下降速率或通货膨胀的起伏。深度学习则特别适合非结构化大数据集的预处理,例如它可应用于分析卫星图像中的汽车、或新闻稿中的情绪。

  国内一家研究机构借鉴了谷歌和斯坦福大学的论文《文本分析对于股票价格预测的重要性》,并将深度学习的算法进行改良后预测股价。它利用NLP(自然语言处理)技术从美国证券交易委员会的文件和新闻中提取信息,并用四种深度学习算法预测文件发布后的股票价格变化。这四种算法包括:一个多层感知器完全连接的网络—MLP;两个一维卷积层—CNN;双向GRU层—RNN;一维卷积层及GRU层—CNN-RNN。

  数据集经过预先的处理,然后被随机打乱,并分成80%的训练集和20%的测试集。经过23轮训练后,研究人员发现CNN-RNN模型准确性最高。最终模型预测股价的准确率为64.5%,比以往的随机选择算法提升了94%,充分体现了深度学习算法的优越性。

  通联数据的萝卜投资在机器学习领域已经进行了长期布局,例如使用NLP技术进行研报抽取与新闻舆情监控,以及利用时间序列预测等模型进行宏观预判与行业、公司盈利预测。萝卜投资相信,机器学习技术在资产管理领域有着广阔的应用空间,有助于显著提升资产管理者的信息处理能力和投资决策能力,从而开辟一条全新的智能投资之路。

下一篇:棋人棋事:南粤围棋英雄大检阅