前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

  人工智能(AI)还没有准备好取代你的基金经理 ,一系列公开测试说明了其中缘由 。

前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人-第1张图片

  在全球领先AI模型参与的一系列新的交易竞赛中,迄今为止AI的表现并不算好。大多数系统蒙受了亏损。它们交易过于频繁,在收到完全相同指令时会作出截然不同的决策 。而且目前仍无人知道 ,这些缺陷会否随着模型迭代升级而消失 ,还是揭示了大语言模型与市场实际运作方式之间存在的根本性鸿沟 。

  以科技初创公司Nof1运营的Alpha Arena为例。该平台让八个主要前沿AI系统同台较量,开展四场比赛,其中包括Anthropic的Claude 、谷歌的Gemini、OpenAI的ChatGPT以及埃隆·马斯克的Grok。每个系统在每场比赛开始前都获得1万美元资金 ,随后在两周内自主交易美国科技股 。挑战包括依据多种信号交易、采取防御性策略 、对竞争对手表现作出反应,以及使用高杠杆操作。

  整体投资组合最终亏掉了约三分之一资金。在全部32组结果中,模型仅有6次实现盈利 。Grok 4.20在一项可获知竞争对手表现的挑战中取得最佳成绩。它只进行了158笔交易;在相同提示下 ,阿里巴巴的千问则交易了1418次。

  Alpha Arena只是越来越多相关实验中的一个 。这些实验都在测试,大语言模型能否胜任金融业最困难的工作:战胜市场。尽管这些竞赛远谈不上具有学术严谨性,但它们迄今最公开地展示了 ,当这些系统尝试承担华尔街一些利润最丰厚 、风险最高的工作时,会发生什么。

  这些初步结果之所以重要,是因为交易正是金融业对于完全交给AI仍保持谨慎的少数工作之一 。过去几年 ,从摩根大通到Balyasny Asset Management等行业巨头,几乎已将这项技术用于其他各个环节。如今,大语言模型已在量化机构中用于解析新闻 ,在对冲基金中起草备忘录 ,在大型银行中识别欺诈等。但在真金白银的交易上,“人类参与”仍是行业信条,似乎也是情有可原 。

  Nof1创始人Jay Azhang表示:“大语言模型本身其实无法真正赚钱 。你基本上需要一整套非常复杂的约束框架、支撑系统和数据平台 ,才有可能给它们一个发挥的机会。 ”

  他说,大语言模型擅长做研究,也擅长为某些任务寻找并调用合适工具。但它们目前仍不知道 ,影响股价波动的诸多变量 —— 包括分析师评级、内部交易和市场情绪变化等 —— 各自究竟有多重要 。它们往往把握不好交易时机,错误设定仓位规模,而且买卖过于频繁。

  AI博客Flat Circle追踪了11个与市场相关的竞技平台 ,所有平台都至少有一个模型实现盈利。但在这11个平台中,只有两个平台的模型中位数实现盈利,这表明大多数模型都难以战胜市场 。

  这一结果与人类的表现如出一辙 ,因为众所周知,多数主动管理型基金同样跑输大盘。而且就像人类一样,这些模型也容易出现明显偏颇。多场竞赛显示 ,AI系统在收到相同指令时会作出非常不同的决定 ,这对部署它们的机构具有重大影响 。Azhang举例说,在Alpha Arena最近一轮比赛中,Claude大多倾向做多 ,Gemini并不排斥做空,而千问则更愿意借助高杠杆承担风险。

  运营Intelligent Alpha的Doug Clinton表示:“它们有自己的‘个性’,你必须像管理人类分析师那样去管理它们。”他说 ,如果让模型意识到自己表现出某种偏见,结果可以得到改善 。Intelligent Alpha有一个由大语言模型驱动的基金,就AI预测企业盈利的表现发布其自身的基准。

  Intelligent Alpha的基准为10个AI模型提供财务申报文件 、分析师预测、业绩电话会纪要、宏观经济数据以及最多10次网络搜索权限。由于聚焦范围更窄 ,大语言模型在这项测试中的表现更为积极 。2025年第四季度,OpenAI的ChatGPT对盈利预期变动方向的判断准确率达到68%,创下迄今最佳成绩 。Clinton表示 ,这些模型通常会随着每次新版本发布而持续改进。

标签:

相关推荐

  • 疫情国家解除/疫情国家解除隔离了吗

    疫情国家解除/疫情国家解除隔离了吗

    捷克新冠病毒新闻播报--捷克正式把中国移除出疫情国名单捷克政府已正式宣布将中国、韩国移除出重大疫情爆发国名单,同时公布了疫情数据、高风险国家名单、部分限制解除计划及口罩配发方案。具体内容如下:疫情数据:截至3月26日中午12点,捷克累计感染人数为1775人,其中6人死亡(均为70岁以上且有严重慢性疾病的老人)。布拉格及其周边地区仍是感染人数比较多的区域。月...

    2026/05/07
  • 印度疫情破万(印度疫情日增11万)

    印度疫情破万(印度疫情日增11万)

    印度疫情失控渐成血崩态势,人间炼狱下的印度恐成全球疫情炸药包〖壹〗、印度疫情失控对全球的影响全球疫情新炸弹:印度作为人口超级大国,疫情失控不仅导致国内感染人数激增,还可能通过人员流动将变异病毒传播至其他国家,引发全球疫情反弹。周边国家风险:印度疫情失控可能波及周边国家,引发连锁反应,导致疫情在更大范围内扩散,形成冰山效应,最终引发雪崩式传播。〖贰〗、印度...

    2026/05/07
  • 疫情诚信应考(疫情期间的诚信)

    疫情诚信应考(疫情期间的诚信)

    山西一级建造师考试防疫要求山西一级建造师考试防疫要求如下:考生须严格遵守考试疫情防控管理要求,诚信考试。凡违反我省常态化疫情防控有关规定,隐瞒、虚报旅居史、健康状况等疫情防控重点信息的,将依法依规追究责任。考生参加考试前,须通过支付宝、微信等APP登录政务服务平台,点击“防疫健康信息码服务”,申领个人健康码。在考试全程应当佩戴一次性医用外科口罩(除核验身...

    2026/05/07
  • 小区看门疫情(小区门口检查疫情)

    小区看门疫情(小区门口检查疫情)

    60多了能干什么工作城市绿化养护工作适合60岁左右的人,工作内容包括施肥、修剪、浇水、除草等,月收入约3000元。小区门卫工作对60岁左右的中老年人有优势,因为他们的睡眠少、做事认真,可以安心值班。这份工作的收入虽然不高,但可以从事一些副业如垃圾总结、宠物托管、快递收纳等来增加收入。0岁人群适合的工作类型多样,可根据体力、技能和兴趣选取社区服务、养老护理...

    2026/05/07
  • 前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

    前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

      人工智能(AI)还没有准备好取代你的基金经理,一系列公开测试说明了其中缘由。  在全球领先AI模型参与的一系列新的交易竞赛中,迄今为止AI的表现并不算好。大多数系统蒙受了亏损。它们交易过于频繁,在收到完全相同指令时会作出截然不同的决策。而且目前仍无人知道,这些缺陷会否随着模...

    2026/05/07
  • 【镇口疫情,镇口村委会电话】

    【镇口疫情,镇口村委会电话】

    乡镇关于新冠肺炎疫情防控工作问题整改情况汇报〖壹〗、整改情况:我镇已通过手机微信群、短信平台等,逐层向全镇干部群众发送了疫情相关信息及防控要求,讲清疫情严峻性,劝导群众不扎堆、不聚会,并成立了督查组对群众聚集多发地开展全天候巡查,各村基本不存在扎堆聊天不戴口罩的现象。下一步,我镇将举一反三,加大宣传力度,杜绝此类现象发生。〖贰〗、根据区疫情应急指挥部纪律检...

    2026/05/07
  • 疫情国庆贵州/贵州中秋国庆疫情防控通知

    疫情国庆贵州/贵州中秋国庆疫情防控通知

    【甲秀评】疫情防控不能「放假」疫情防控不能松懈的必要性本地风险未完全消除:贵阳虽已实现社会面动态清零,但疫情传播风险仍存,「外防输入、内防反弹」任务艰巨。若放松警惕,可能导致疫情反弹,威胁前期抗疫成果。全国及省内形势严峻:全国疫情呈多点散发态势,贵州省内防控形势亦复杂。如因疫情防控形势或其他不可抗力因素需调整相关考试安排,我院将及时作出通知。请考生密切关注...

    2026/05/07
  • 学生疫情出省(学生疫情出省要隔离吗)

    学生疫情出省(学生疫情出省要隔离吗)

    高校学生出省会被学校发现么高校学生出省的行为,如果依赖身份证和手机的话,几乎会被学校发现。如今,借助大数据技术,通过你的身份证使用记录和手机定位信息,学校能够追踪你的行踪。即便不使用身份证和手机,除非学校有特殊需求了解你的行程,否则一般情况下不容易查到。然而,在当前的疫情背景下,为了大家的安全和健康,建议尽量减少不必要的外出。肯定会发现的,现在手机都有定位...

    2026/05/07
  • 【忠信疫情,忠信镇是哪个县的】

    【忠信疫情,忠信镇是哪个县的】

    2022年冠县忠信学校什么时候开学〖壹〗、截止到2022年9月14日显示在2022年4月3日冠县忠信学校全面复学。接县疫情防控指挥部通知,清明节三天4月3号、4号、5号正常放假。各学段复学计划如下:4月6号初中、高中职全面复学,4月7号小学段全面复学,4月8号幼儿园全面复学。复学时间根据全县疫情形势适时调整,具体复学时间以通知为准。〖贰〗、冠县忠信高中的二...

    2026/05/07
  • 辽宁疫情查询(辽宁疫情防控情况)

    辽宁疫情查询(辽宁疫情防控情况)

    辽宁省哪些地方有疫情〖壹〗、辽宁省14个市有疫情。根据相关资料查询截止2022年11月26日辽宁省14个市有疫情分别为:铁岭、沈阳、盘锦、抚顺、大连、锦州、辽阳、丹东、葫芦岛、阜新、朝阳、鞍山、营口、本溪。〖贰〗、四个城市。据查询辽宁省防疫办了解到截止2022年12月8日辽宁省四个城市有疫情,分别是沈阳市30例,大连市2例,阜新市1例,盘锦市1例为新增本土...

    2026/05/07
返回顶部