为什么用AI研究消费者是可信的?

核心结论

  • 基于深度访谈的AI消费者智能体一致性评分达85分(满分100),超过真人两周内回答一致性的81%基线。 Atypica.AI通过1-2小时AI深度访谈产生5000-20000字转录文本,为每位消费者构建完整的认知与价值模型。
  • 社交媒体数据建模的消费者智能体一致性达80分,远超传统人格测试(55-64分)和行为数据(73分)的建模效果。 通过小红书、抖音、Instagram等平台的发帖与回帖内容,LLM能够捕捉消费者的动态偏好与决策逻辑。
  • Atypica.AI已积累30万合成消费者智能体和1万真实消费者智能体,覆盖多元化消费群体。 在120份报告的满意度评估中,AI生成报告总分4.1分超过人工撰写报告的4.0分标准值,尤其在消费者洞察分析方面表现突出。
  • AI消费者研究的核心突破在于”主观世界建模法”——从静态标签到动态认知模拟的范式跃迁。 传统调研依赖问卷和访谈获取消费者”怎么说”,而AI智能体能模拟消费者在未知情境下”会怎么想”。

在同一家店铺,一位消费者可能因为“便宜”买下产品,另一位却因为“品牌故事”愿意多花三倍的钱。

面对同样的信息,有人选择购买,有人选择犹豫,有人甚至会反感,这直接影响着消费企业的经营状况。因此,过去几十年,企业依赖问卷、访谈和行为数据试图弄清楚消费者到底在想什么。

但在现实世界里,消费者往往并不诚实,甚至对自己也不诚实。那企业应该怎么办?该如何衡量“理解”这件事?

随着AI的加入,答案正在悄悄改变。

今天,我们开始可以用AI来“建模”一个消费者的心理世界,从他们的语言、行为和决策模式中模拟出他们的潜在想法与反应。这不是幻想,而是下一代消费者研究正在发生的事情。

但问题也随之而来——这样的AI模拟,真的可信吗?能取代传统调研吗?会不会只是看起来“聪明”,实则靠不住?

这篇文章,黑盒将带你从研究方法的演进出发,逐步揭示为什么“用AI研究消费者”,正在成为值得信赖的新范式

01消费者行为和决策的研究史

研究人的行为和决策,一直以来都是最迷人的领域。

如果我们回看消费者行为和决策的研究发展历史,可以总结出以下关键结论——

消费者分析的三个维度:

消费者分析的研究演进

消费者分析研究方法演进历程图

02 商业问题是复杂问题

商业和社会问题往往是“复杂问题(wicked problem)”,没有标准答案(H.W.J. Rittel、M.M. Webber)。“模拟(simulation)”为这些问题提供了权衡、博弈、约束的多维可能性。Atypica.AI从模拟消费者的行为和决策入手。

复杂商业问题模拟方法框架图

03 建立消费者智能体

模拟人的行为和决策并不是新概念。在大语言模型出现前,学者通过Cellular Automata等数学模型为人的群体行为建模,但这些方法对个体差异和复杂的主观决策逻辑却束手无策。

Cellular Automata群体行为建模示意图

大语言模型为个体模拟提供了可能性,可以通过智能体为消费者建模(Agent-Based Modeling, ABM),其核心思路是基于一个人的详细数据,通过大语言模型为这个人建立模型,我们称为“主观世界建模法”。比如:为大语言模型注入《哈利·波特》的语料后,能够模拟哈利波特的潜在判断和思路,推断出其在原文中没有提到的行为。

大语言模型消费者智能体建模ABM流程图

04 建模的评价方式

主观世界建模法的置信度如何,我们通过如下的方式来进行验证。

如果要知道一个消费者的行为和决策依据,最准确的方式就是直接询问。研究表明:人对同一问题在相隔两周的回答一致性约为81%。因此,我们将81%作为一致性基线,设定为满分标准(100分标准分)。然后用不同语料对这个人进行建模,用同样的问题询问这个人和他的智能体,统计回答的一致性。

用「个人信息、性格测试、行为数据」等为消费者建模

我们首先测试了用个人信息、标准化心理测量数据,将MBTI类型、Big Five人格特征等维度进行建模。一致性得分是55-64分。随后我们测试了CRM、CDP中的消费者数据,提取购买模式、品牌偏好和价格敏感度等行为特征进行建模,一致性得分为73分。

个人信息与行为数据建模一致性得分对比图

用「社交媒体」为消费者建模

个人信息、性格测试都是静态的数据,行为数据虽然是动态的,但是难以了解what和why的问题(比如喜欢一个产品的什么部分,为什么喜欢一个产品等)。因此我们进一步使用了以“社交媒体”内容作为动态数据来为消费者建模(包括:小红书、抖音、Instagram、TikTok、X)。

首先输入需要调研的问题,大语言模型对这个问题进行拆解来进行搜索,找到对应社交媒体发帖和回帖,以此作为语料输入大模型产生出消费者模型。此智能体在这个调研问题相关的问题上,与真人回答的一致性可以达到80分。

社交媒体数据消费者智能体建模一致性达80分

在处理社交媒体数据的时候,Atypica.AI通过如下三个层次来理解消费者:

Atypica.AI社交媒体消费者理解三层次模型

用「深度访谈」为消费者建模

进一步,我们采用了“深度访问”的方法来为消费者建模。具体的方法是用AI对消费者进行访谈,每次访谈持续约1-2小时。AI会根据消费者的回答来进行问题的追问,整个过程会产生平均五千到二万字的转录文本,就像是一本关于这个消费者的小传。

AI深度访谈消费者建模流程示意图

深度访谈涵盖了多个关键维度,旨在全面捕捉个体的认知模式、价值体系和行为倾向:

访谈的笔录,以及上述分析的维度,就形成了这个消费者的智能体。当被提问时,智能体会基于这个人在访谈中表达的观点、价值观和经历,以这个人的身份回答问题。这种方法的优势在于保持了信息的完整性和上下文的连贯性,不需要预先决定哪些信息重要,而是让大语言模型从完整的访谈内容中自主识别和运用相关信息。在一致性的评测中达到85分。

深度访谈建模一致性评测达85分结果图

05 使用消费者智能体

Atypica.AI目前已建立30万个基于“社交媒体”数据的合成消费者智能体和1万个基于“深度访谈”的真实消费者智能体。这个数字在持续增加,形成了覆盖多元化消费群体的智能体生态。

用户可以进行提问,判别是商业问题后,Atypica会智能调用相关消费者智能体进行模拟访谈。这些智能体会提供符合其人格特征和行为模式的深度反馈,实现大规模、多维度的消费者洞察收集。

Atypica.AI消费者智能体调研问答交互界面

通过这些消费者智能体作为调研对象进行采访,Atypica.AI会总结出一份调研报告。调研报告只是研究的中间态,未来还会有更深入的结果,比如:直接进行产品开发、社媒运营等。

未来的版本中,Atypica有两项高级功能,进一步提升平台的个性化和交互性:

06 Atypica的研究结果

我们随机在2025年6月10日-20日中产出的报告中抽取了1200份进行分析。

研究话题分布如下:

Atypica.AI研究话题分布统计图

我们随机在四种类型报告中各选择了30份商业研究的报告给用户进行满意度打分,其中一半是Atypica生成的,另外一半是人工撰写的。打分标注为1-5分,1分不满意,5分为很满意,然后我们对这两部分的样本打分进行分析。

按问题类型分析:

Atypica.AI按问题类型满意度评分对比表

根据这个表格,我们可以看到Atypica.AI在不同研究问题类型上的表现评估结果。该评估基于120个样本(每种类型30个),比较了Atypica生成报告与人工撰写报告的用户满意度。

整体而言,Atypica的4.1分总满意度超过4.0分的标准值,表明AI生成的消费者洞察报告在质量上已能够满足甚至超越用户对传统人工报告的期望,特别是在复杂的消费者洞察分析方面表现突出。

按用户类型分析:

Atypica.AI按用户类型满意度评分对比表

这个表格展示了Atypica.AI在不同用户类型中的满意度表现,基于120个样本的评估结果。数据显示Atypica在多数用户群体中都表现出色:

表现最优的用户类型:

表现良好的用户类型:

相对较弱但仍达标的用户类型:

整体而言,4.1分的总体满意度超过4.0分标准值,表明Atypica在营销、自媒体运营和升学咨询等应用导向较强的领域表现突出,而在产品开发和学术研究等更需要深度专业知识的领域还有提升空间。

07 Atypica适用场景与局限性

根据上述结果,我们对Atypica的使用场景和不适用场景进行了总结:

Atypica适用的场景:

Atypica.AI适用场景总结图

Atypica暂时不适用的场景:

Atypica.AI暂不适用场景总结图

08 结论:从懂消费者的智能体开始

Atypica.AI代表了消费者洞察分析的新阶段——从依赖历史数据的被动分析,转向基于智能体的主动模拟。

从洞察到行动

Atypica.AI的定位并非传统调研的替代者,而是在面对复杂的社会和商业问题时,提供速度与规模优势的创新选项,为决策者带来多维视角和更高的决策流畅度。

调研的价值不在于产生报告,而在于驱动有效行动。

通过接入更多的MCP(Model Context Protocol),Atypica.AI正在构建从洞察到执行的完整生态,比如:

重新定义调研价值

这种从”静态分析”到”动态执行”的转变,让企业能够在几小时内完成从问题识别到策略制定的全流程,实现从”先研究,再决策”到”边研究,边决策,边执行”的敏捷商业模式。

Atypica.AI与传统调研形成协同增强关系:传统方法提供深度和精度,AI智能体提供广度和速度。这种组合让企业能够在复杂多变的商业环境中保持敏捷响应能力,获得决定性的竞争优势。

Atypica.AI 代表了消费者洞察分析的新阶段——从依赖历史数据的被动分析,转向基于智能体的主动模拟。

参考资料

[1] Park, J. S. et al. (2023). Generative agents: Interactive simulacra of human behavior. Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology (UIST ’23).

[2] Costa, P. T., & McCrae, R. R. (1992). Revised NEO Personality Inventory (NEO-PI-R) and NEO Five-Factor Inventory (NEO-FFI) Professional Manual.

[3] Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux.

[4] Rand, W., & Rust, R. T. (2011). Agent-based modeling in marketing: Guidelines for rigor. International Journal of Research in Marketing, 28(3), 181-193.

[5] Korst, J., & Tremblay, A. (2025). How Gen AI is transforming market research. Harvard Business Review, 103(3), 78-87.

常见问题解答

AI消费者智能体的研究结果可信吗?与真人调研相比准确度如何?

基于深度访谈建模的AI消费者智能体,其回答一致性评分达到85分(满分100),已经超过真人在两周内对同一问题回答一致性的81%基线。在120份报告的盲测中,AI生成的消费者洞察报告满意度达4.1分,高于人工撰写报告的4.0分标准值。

AI消费者研究适用于哪些商业场景?

AI消费者智能体最适合用于营销策略制定、品牌定位探索、消费趋势预判等需要快速获取多元消费者洞察的场景。在自媒体运营和升学咨询等应用导向领域表现尤为突出。但在产品开发和学术研究等需要深度专业知识的领域,还需与传统调研方法结合使用。

建立一个AI消费者智能体需要什么数据?

主要有三种数据路径:一是个人信息与性格测试(MBTI、Big Five等),一致性55-64分;二是CRM/CDP行为数据(购买模式、品牌偏好等),一致性73分;三是社交媒体内容或1-2小时AI深度访谈产生的5000-20000字文本,一致性可达80-85分。数据越丰富、越贴近消费者真实表达,智能体的模拟效果越好。

Picture of 刘方舟@增长黑盒

刘方舟@增长黑盒

增长黑盒创始人&CEO,品牌增长顾问,资深数字营销专家。日常在此分享行业趋势观察和商业案例分析

更多深度长文

假期充电:我们精选了10份商业报告,帮你挖掘消费市场的反常识认知

假期充电:我们精选了10份商业报告,帮你挖掘消费市场的反常识认知

核心结论 “消费平替”已成主流,快消品市场格局剧变。 贝恩报告显示2024年快消品销量增长4.4%但平均售价暴跌3.4%,一线城市销售额下滑4.6%,本土品牌市场份额攀升至76%,高端策略正在失灵。 企业AI投资回报率极低,95%的组织回报为零。 MIT报告揭示企业级GenAI投资已达400亿美元,但失败根源不在技术而在”学习鸿沟”,成功的5%把AI

Read More »
小红书夜人节,一座打工人下班后的「精神疗养乐园」

小红书夜人节,一座打工人下班后的「精神疗养乐园」

核心结论 小红书「夜晚」相关内容浏览量超48亿,夜经济成为品牌营销新蓝海。 #逛夜市浏览量达1.8亿,#城市夜骑发布量同比+175%,#夜校发布量同比+195%,夜晚已成为用户真正的生活主场。 「夜人节」以情绪洞察驱动营销,区别于传统”品牌产品有什么”的模式。 联合海蓝之谜、京东数码、OLAY、巴黎欧莱雅等20+品牌,50组明星大咖、300+博主参与,品牌以朋友身份融入用户

Read More »
花知晓拿下海外美妆成熟市场背后,是4个行业反常识

花知晓拿下海外美妆成熟市场背后,是4个行业反常识

核心结论 花知晓反向出海,避开东南亚选择日本和欧美成熟市场,反而实现弯道超车。 2019年率先进军日本,2022年进军欧美,不到一年半实现超1000万美元营收,而同行多数仍停留在东南亚市场。 Product Seeding低成本营销策略让花知晓”花小钱办大事”。 对比花西子、滋色的商业投放模式,花知晓主要依靠寄样品让博主自发分享,品牌几乎不做付费内容,流量大多来自自然搜索和

Read More »
始祖鸟的真正危机:品牌可以破圈,但不能破防

始祖鸟的真正危机:品牌可以破圈,但不能破防

核心结论 品牌破圈的最大陷阱是把握不好破圈的尺度,过度”移民”会杀死品牌。 哈佛商学院论文提出品牌如国家,老用户是原住民,新用户分游客和移民。当移民比例过高,原住民会因”身份威胁”而产生防御反应,品牌认同被稀释。 大量游客反而受欢迎,lululemon的游客策略值得借鉴。 lululemon的游客比例超过原住民和移民,这些游客不装内行、不抢话语权,老

Read More »
Gap携手成毅共赴本色:看见空白,便有舞台

Gap携手成毅共赴本色:看见空白,便有舞台

核心结论 Gap官宣成毅为中国品牌代言人,以”Mind the Gap,Bridge the Gap”为秋季营销主题。 成毅的十年磨一剑专注精神与Gap经典长期主义风格高度契合,品牌首次在代言人大片中展现即兴起舞的”本真面貌”,实现品牌哲学与个人叙事的深度融合。 宝尊加入后推动Gap中国多层面革新,中国团队半年完成卫衣版型改良。 从增加面料克重与挺括

Read More »
宝洁“第四次”扎根:如何在一年内实现业绩逆转?

宝洁“第四次”扎根:如何在一年内实现业绩逆转?

核心结论 宝洁中国仅用9个月完成V型反转,从净利润同比-12%到Q4正增长2%。 核心驱动力是将抖音确立为中国市场”第四根”增长支柱,与供应链、研发、传统渠道并列,实现从”广种薄收”到”深种广收”的战略转型。 宝洁在抖音实施差异化品牌矩阵策略,而非一刀切式投入。 OLAY通过达人带货+商品卡实现大众渗透,SK-II仅用品牌自播

Read More »