2024 年10月,在信息检索和数据挖掘的国际学术会议CIKM (International Conference on Information and Knowledge Management) 上,京东探索研究院院长、京东科技人工智能业务负责人何晓冬博士发表的研究成果DSSM模型(基于点击数据学习用于网络搜索的深度结构化语义模型:Learning deep structured semantic models for web search using clickthrough data)因对内容推荐架构产生重大影响并为产业带来巨大的经济效益,荣获 CIKM 2024年唯一的“最佳时间检验奖(Test of Time Award)”。
CIKM 由ACM SIGIR分会主办,是信息检索和数据挖掘领域的顶级学术会议之一,因CIKM论文的研究成果经常得到产业界的采纳,所以CIKM也是少数受到学术界和产业界共同关注的活动,只有少数高质量的论文能够脱颖而出被录用,2024年CIKM的录用率仅为23%。每年的“最佳时间检验奖”更是彰显了论文在学术和产业上的双重价值——以在过去10年产生重大和持续影响为评选标准。
本次获评的DSSM双塔模型是各类双塔模型的开山之作,奠定了召回和粗排阶段的基础架构,为后续众多改进型双塔模型奠定了基础。
DSSM双塔模型最大的特点是,user 和 item 是独立的两个子网络,即分别使用相对独立的两个复杂网络构建用户相关特征的 user embedding 和 item 相关特征的item embedding,因而被称为双塔模型。
DSSM模型不仅为内容推荐系统的基础模型和架构奠定了坚实的基础——是深度语义学习方向最基础的模型结构,解决了语义相似度计算的问题。2016年,图灵奖得主Yoshua Bengio和Ian Goodfellow(GAN的发明者)、Aaron Courville三人共同编撰的深度学习领域奠基性教材《Deep Learning》(引用量3万余次)一书中就将本次获评的DSSM模型视为基于内容的推荐系统的基础架构。同时,因为兼顾性能与效率,DSSM 模型对产业界十分友好,在发布后的10年中得到了大量的应用。
DSSM 深度语义匹配模型最早是应用于 NLP 领域中计算语义相似度任务。语义匹配本身是一种排序问题,和推荐场景不谋而合,所以 DSSM 模型被自然的引入到推荐领域中,如搜索引擎检索、广告相关性、问答系统、机器翻译等。过去10余年,深度学习技术的应用极大地提升了互联网搜索引擎的语义理解能力、信息检索效率和用户搜索体验,使得搜索结果更加精准、丰富和个性化。头部搜索引擎,电商平台的搜索、推荐和广告业务中都大量采用了该技术,产生了巨大的经济价值。
何晓冬博士曾表示,“在多年的技术落地实践中,我们意识到,用AI来提升、赋能传统实体行业才能最大化影响力和应用价值,传统实体行业的体量足够大,提升1%就能创造巨大的应用价值。”何晓冬博士在京东科技负责人工智能在产业上的落地应用,近年来陆续与团队研发出了智能客服、数字人直播、智能外呼等多项专业可信赖的AI产品,在零售、物流、金融、政务文旅等领域获得了广泛应用。据公开消息,京东云言犀数字人已服务超5000家品牌,带动销售额超百亿;智能客服覆盖了消费者进店后30多个关键环节,可自动化应答售前、售中、售后全场景90%的服务咨询,服务品牌商家数量超40万;智能外呼与政务热线紧密结合,助力大同、东莞、保定、芜湖多地12345热线实现数智升级……
技术创新是企业发展的重要驱动力。不少技术人认为,能否让技术拥有广袤的实践场景,产生应用价值,是考评是否加入该企业的终极门槛。以京东为例,京东创立20多年来,持续投入供应链基础设施和技术创新应用,为用户带去“多快好省”的极致体验,也推动品牌和商家实现降本增效,不仅拥有海量应用场景,更积累了大量专业数据。可以说,技术与创新的基因早已植入京东的发展脉络。这也是京东可以让大量技术人在真实场景中充分发挥创造力,持续推出多项专业可信赖的AI等技术创新的重要原因。