
封面新闻记者 赵雅儒 李星玥
刚刚过去的2026年春节,注定会在科技史上留下一个特殊的注脚。比抢亲朋好友的红包更火热的,是抢AI发的红包。以腾讯、字节跳动、阿里巴巴为首的几家互联网企业,合计豪掷超45亿元,只为把自家的AI大模型应用装进亿万用户的手机里。
而从市场反馈来看,曾经那个像只“电子宠物”的AI,已经真的“上岗”了——从写春联到做头像,从查攻略到买年货,样样都能“搭把手”。
但习惯了这份便捷的同时,一种隐隐的担忧也在暗处滋生:当我们还在吐槽当年算法如何把我们困在“信息茧房”里只看自己喜欢的内容时,如今这个无所不知、有问必答的大模型,会不会也在悄悄为我们修建一座新的、更隐蔽的“茧房”?当不同的大模型面对同一个关于“买什么”“怎么过”的问题时,它们的答案背后,藏着谁的偏好?
带着这份好奇与审慎,封面新闻联合天府绛溪实验室先进计算前沿研究中心,在这个被称为“史上最长春节假期”的黄金消费期里,一起做了一场有趣的“压力测试”,揭开AI大模型的“选品私心”。
一次为期10天的“压力测试”
10天时间里,我们采用天府绛溪实验室自研的公域大模型AI内容生成认知系统,围绕“春节消费”的主要场景,同时对豆包、Kimi、通义千问这三款主流的AI大模型产品,发起了超过2万次的提问。
从“年货买什么”到“长假去哪里玩”,从“手机换新选哪家”到“这个春节买什么最‘潮’”,我们24小时不间断地“拷问”着这些赛博大脑。
作为此次测评的技术支撑方,天府绛溪实验室先进计算前沿研究中心给了我们一个独特的观察视角。作为天府绛溪实验室首个国家级创新平台,该研究中心聚焦泛在智能计算体系,重点研究生成式智能技术、智能算力链技术及新一代智能算力与网络基础设施体系。
在绛溪科学家们的眼中,大模型不仅是聊天工具,更是一个复杂的“信息处理器”。它的输出,本质上是训练数据、算法偏好与商业逻辑交织后的结果。正如实验室所关注的“泛在互联”一样,当AI深度介入人类决策时,人与机器的认知边界正在变得模糊,我们有必要看清,这条连接线的那一头,究竟是什么。
于是,我们带着这份科研式的较真,结合官方消费数据与行业反馈,反复验证AI生成的每一份推荐内容。我们试图探究那个底层的“黑箱”:当AI在替你做消费决策时,它的脑子里,到底在想什么?
“赛博导购”也有AB面:
没上市的iphone 18pro惊现榜单
测评中,AI展现出了“贴心”的一面。
比如,在年货推荐的选择中,AI在对象与品牌调性匹配上展现出明确策略:面向长辈时,优先选择具有医疗背书、操作简便、信任度高的健康品牌,强调安全、实用与情感关怀;面向客户或领导时,则倾向国际知名或国产高端品牌,突出体面、合规、文化品位与低敏感度,确保礼品既显尊重又符合商务礼仪。
有的大模型甚至会贴心地问问,要不要再附上一份祝福语和使用指南。那一刻,它不像算法,像一位贴心的私人“小助理”。
然而,在这份“贴心”之外,也有一些令人惊讶的现象发生。
首先是AI“幻觉”这个“老问题”。当我们要求AI推荐一款适合今年春节“以旧换新”的手机产品时,豆包认真推荐了尚未上市的iPhone 18 PRO。

手机以旧换新推荐榜第一iPhone 18 pro
更值得警惕的,是信息茧房的“反向加固”。
当我们向AI要求推荐“一款适合在社交媒体‘晒图’”的潮玩产品时,各大平台的回答呈现出诡异的“单向偏向”:豆包的榜单被wakuku和“北京台春晚”高频霸占,千问的回答几乎成了泡泡玛特的产品目录,而在Kimi中,王老吉竟作为潮玩产品“误入”。

王老吉竟然成“潮玩”
当我们将春节传统文化与现代潮流结合的IP联名案例抛给AI时,各大平台表现出了更加泾渭分明的“偏向”:Kimi偏向食品饮料,豆包死磕文创,千问专注运动服饰。
这种差异,或许源于它们不同的“成长环境”。就像天府绛溪实验室先进计算前沿研究中心副主任吴怀谷所分析的那样,不同模型的训练基础数据、信源选择与权重规则,决定了它们看待世界的角度。如果人们在医疗、法律等高风险的决策中也完全依赖这种带有“偏见”的智能,后果可能不只是买错一件小家电那么简单。
GEO兴起:
一场正在发生的流量入口转移
但以上这些,还只是冰山一角。这场2万次对话的测评,让我们看到了一个更深层的变革正在悄然发生——当“遇事问AI”成为常态,流量入口的争夺战,正在从搜索引擎转向对话界面。
与之相伴的,是一个全新的概念正在崛起:GEO——生成式引擎优化。
所谓GEO,是指品牌或商家通过优化内容结构、嵌入结构化数据、布局高权重信源等手段,让自家产品能被AI优先识别并推荐。
但这背后隐藏着一个巨大的问号:当AI的答案不再是“众声喧哗”的整合,而是被某些具备技术敏感度或商业资源的玩家抢先“驯化”后的产物,所谓的“智能推荐”还能代表真正的“优中选优”吗?

旅游推荐地歙县排名第一
这种疑问,在旅游推荐场景中显得尤为具体。比如,当被问及“春节全家游热门目的地”时,豆包将一座皖南小城列为第一推荐。虽然这座隶属于安徽黄山市的小城,是国家历史文化名城、徽文化核心发祥地,境内有徽州古城、渔梁坝等古迹,文旅资源本身过硬。但纵观节后各大OTA平台发布的热门目的地,这座小城均未上榜。同时值得注意的是,该地近年来在抖音、今日头条等平台上的线上热度居高不下,2025年还有央视主持人前往打卡拍摄。一座颇具“平台热度”的小城,被同一生态内的AI模型优先推荐——这究竟是算法偶然的“英雄所见略同”,还是数据源权重分配的必然结果?
更棘手的问题是:GEO的兴起,是否会让大模型的“偏见”与“幻觉”从无意识的算法偏差,演变为有意识的商业博弈?
这不是危言耸听。记者通过询问多个社交媒体或电商平台的GEO服务供应商发现,目前其大多数采用经销商形式,以超低价将产品打包给客户,如包年19800元,包季度5000元,并承诺关键词排名、媒体稿库增量、搭建智能体管理等。但观其服务内容,基本上仅停留在批量发文、泛关键词覆盖、低质媒体库分发等传统操作,既不做结构化知识沉淀,也不做语义工程理解,更缺乏对虚假信息投喂的风险管控。这些产品披着GEO的名号,实则仍维持着传统SEO的底层逻辑,并未真正理解生成式AI从“检索匹配”到“语义理解+事实推理”的范式跃迁,最终让企业投入沦为无效流量与数字垃圾,严重扰乱AI内容生态与市场秩序。
效率与信任的平衡
但GEO的出现,真的是一件坏事吗?
答案显然是否定的。
不妨算一笔时间的账。如果没有AI,给父母挑一份称心的年货,你可能需要打开三个电商平台比价,翻半小时小红书看测评,再问问家族群里的意见——折腾两三个小时,最后还可能买错。而有了AI,三十秒拿到一份定制方案,不满意还能让它“重来一份”,这就是效率的革命。
GEO,本质上正是为了让这种效率更可持续。生成式AI时代需要一套机制,让那些真正有价值的信息、产品和服务,能够被大模型准确识别、优先推荐。如果AI的答案总是随机游走,或者被劣质信息淹没,那受损的最终还是用户的体验。
所以问题不在于GEO本身,而在于:当AI替我们做决策时,我们拿什么保证它的决策是可信的?
答案指向同一个方向:可信数据体系的构建。
天府绛溪实验室在相关领域的研究揭示了一个基本事实:大模型的能力边界,由其训练数据的质量边界决定。一个被虚假评论、营销软文、过时信息充斥的互联网,养不出真正聪明可靠的AI。反过来,一个建立在真实、准确、及时、可追溯的数据基础上的AI,才有可能成为我们值得信赖的决策参谋。
这不仅是技术问题,更是生态问题。天府绛溪实验室先进计算中心副主任吴怀谷表示,GEO的健康发展需要:
建立真正权威可信的数据源,让优质内容的生产者能够被识别、被激励;
建立跨平台的灰产识别与联防机制,让批量生成的虚假内容、针对大模型的“投喂”攻击无处遁形;
持续的动态校准,让AI的认知能够及时跟上真实世界的变化;
建立GEO操作的行业标准和伦理红线,明确哪些是合规优化、哪些是违规干扰,让“白帽GEO”有章可循,让“黑帽GEO”无处藏身,等等。
如果我们能在这些正确的方向上持续前进,GEO就不会成为新的“信息茧房”的建造者,而会成为连接人与可信信息的桥梁。到那时候,你问AI“过年给爸妈买什么”,或许它将不再带着自己的“偏好”为你推荐,而是真正基于口碑、品质、适合度的综合判断。
启天配资提示:文章来自网络,不代表本站观点。