超长序列建模 —— SIM 精读笔记

文章链接:https://arxiv.org/pdf/2006.05639

机构:阿里

发布时间:2020

Copyright (c) Wang-Luning. All Rights Reserved.

SIM(Search-based Interest Model,2020)致力于建模超长的用户历史行为序列。其分为两个级连部分,首先从完整的长行为序列(>10000)中筛选出与当前候选目标相关的行为,去除序列中绝大部分噪声,然后再对筛选后的子行为序列(~100)进行深度学习建模,使用类似DIN的方法用attention模块来达成候选物品和历史物品的交互,最终抽象出来的表征用于预测CTR等指标。其参考了DIN中关于针对候选物品来选取序列中有用信息的思想,并设计了一种更高效的从用户行为序列中提取有用信息的方法。

具体而言,首先使用一个“通用搜索单元”(General Search Unit, GSU)来使用候选物品产生的query从原始的长行为序列中提取相关信息,从而过滤掉噪声,获得筛选后和候选物品强相关的子序列SBS(Sub user Behavior Sequence)。然后,使用“精确搜索单元”(Exact Search Unit, ESU)来建模候选物品和SBS之间的精确关系。

image-20260203183534293

GSU和ESU模块最终会在CELoss下进行联合训练(若采用hard search则去掉GSU项):

L=αLGSU+βLESU