谈到金融大数据,一个绕不开的话题就是围绕上市公司的大数据。目前为投资者所熟知和日用的主要以上市公司的交易数据为主,比如成交量、换手率以及一些财务指标数据如资产负债比率、市盈率等等。然而,除这些交易数据以外,公开渠道(传统媒体、论坛博客、微博微信、客户端等)还散乱着各种各样和上市公司有关的信息(学术界统称为多源异构的数据),淳粹传媒CEO曾国伟将这些数据统称为“非交易数据”。
国内首个非交易数据科研团队组建
据透露,作为第一家提出“非交易数据”概念的机构,淳粹传媒已联合知名高校、财经媒体等多家机构共同筹建上市公司非交易数据联合研发中心(TheURDCenterofNon-transactionforListedCompany)。
目前,淳粹传媒已与南开大学等多所国内知名高校签订相关科研项目,组织了涵盖金融、经济、信息、软件、语言等领域的中青年专家对非交易数据进行系统化的理论研究和实证分析。
非交易数据科研项目相关研究人员介绍,目前在欧美已经有一些专门的机构对一些非结构数据进行整合研究,但大部分数据还是集中在社交媒体领域。由于非交易数据牵涉研究的领域广泛,涉及到行为金融、数据挖掘、语义分析等一些前沿学科,所以组织研究队伍难度极大,淳粹传媒经过半年多整合和筹备,才组建了国内首支横跨多学科的非交易数据科研团队。
国外社交媒体非结构数据价值突显
欧洲央行在今年7月份公布的一份报告中称:“推特上的情绪状况从统计学和经济学角度来看对预测美国、英国、加拿大的股价有重大价值。”
欧洲央行报告中所述的“推特情绪指数”可以指导英国、美国和加拿大的股市,但是对中国股市毫无意义。因此,欧洲央行建议中国的研究人员可以对国内类似平台上的情绪进行研究,例如新浪微博,检验其与中国股市是否存在类似的关联。
其实,曼彻斯特大学和印第安纳大学早在2010年10月共同发表的一篇论文中就曾提到,Twitter用户的推文中一些表达情绪的感情词可以用来预测道琼斯工业平均指数的每日动向。研究显示Twitter用户的情绪变化会在指数波动后的2至6天后反映出来。实证研究表明,这类信息能让它们在指数预测准确率方面达到87.6%。
法国商业机构QuantCube已于早前推出智能数据(SmartData),实际上是通过监测市场情绪,并辅助以其它数据分析得出的一系列指数,包括实时的通胀指数、经济增长指数和实时的市场情绪指数等为投资者提供决策参考。
华尔街也正在尝试用户日常交易的“感知和回应系统”,它能自动检查网上博客和推特内容,每日的股票资讯和新闻资讯等,并将这些非结构化的数据转变成可供积极读取的数据,而算法交易者可根据这些数据进行投资决策。
据彭博社报道,总部设在波士顿的对冲基金公司Tashtego即依靠算法,利用社交网路去分析客户情绪和投资者行为数据,从而在美股市场进行交易。
非交易数据研究或填补国内空白
根据美国金融学会的研究(2008),美国股市中上市公司资产价格波动情况中只有50%可以通过上市公司的交易数据来进行分析,而剩余的上市公司资产价格波动的信息则蕴藏在关于上市公司的这些非交易数据中,这些非交易数据在解释股票资产价格异常波动的时候非常管用。
非交易数据科研项目相关研究人员解释,包括社交媒体的情绪指数等在内的所谓非交易数据概念,最终都是希望与和交易数据建立某种关联,从而能为投资行为提供决策参考,从另一层面提高预测的准确性。
举一个简单的列子:如果数据显示某一些资产类别的市场情绪乐观积极,那么就给客户一个买入的提示;反之亦然,如果市场情绪对于某一个或一系列资产类别呈现悲观心态,那么就会建议你卖出。
当然,非交易数据的理论和实证模型比这个例子所讲的要复杂的多,其链条涉及到数据的采集、仓储、清洗、分析等诸多环节,需要不同领域的专家协同参与,甚至可能包括社会学、心理学等等。
“上市公司非交易数据研究和应用在金融大数据领域还属于空白,无论从学术价值,还是商业价值,非交易数据的研究和应用都是开创性的,它或开启金融大数据的新天地。同时我们也衷心也希望更多的专业人士参与到非交易数据这一领域的研究中来。”非交易数据科研项目相关负责人称。 http://finance.chinatradenews.com.cn/html/news/2015/1211/78325.html
http://u.zp.china.com.cn/news-63312-1.html
http://u.zp.china.com.cn/news-63398-1.html
http://qy.bzxhw.com/gdkx/2015-12/11/82004.htm