文章链接:https://arxiv.org/pdf/2403.02545
机构:Meta
发布时间:2024.09
参考文献:
Copyright (c) Wang-Luning. All Rights Reserved.
WuKong推出了一种由多层FM层堆叠成的模型结构,可以实现将浅层FM的交叉结果送入深层FM进一步交叉,从而使得交叉阶数不断增大,有效捕获复杂的高阶特征交互能力,并展现出推荐系统中的scaling law。
将输入中稀疏/稠密特征通过embedding层,产生
FM层(FMB):
用于对本block的输入进行特征交互,多层FM堆叠可以使得交叉阶数上限越来越高,从而捕获高阶特征交互。
具体而言,FMB是由一个FM和后边的一个MLP构成的。FM部分用于显式地对于本层输入的embeddings进行特征交叉(
线性压缩层(LCB):
简单地将本block的输入通过一个线性层进行线性压缩后输出,也即对于输入的embeddings进行线性组合。其不会进行特征交叉,因此也不会增大交叉阶数,但其可以确保第
然后将两部分的输出进行连接,再通过残差连接和norm后得到本block输出:
在这种设计下,第