集类型特定的偏差这使我们能够消除语言表示中的偏差并在测试期间利用在图像标题数据集上学习到的嵌入即使没有输入标题。我们使用语言和视觉编码器对进行前缀调节。在测试期间我们采用用于图像标题数据集的前缀因为该数据集应该涵盖更广泛的场景类型和词汇从而在零样本识别中获得更好的性能。前缀调节的图示。实验结果我们将前缀调节应用于两种类型的对比损失和并与使用和训练的模型相比评估它们在零样本识别任务上的性能。使用前缀调节使用两个数据集训练的和模型显示出零样本分类精度的巨大改进。与使用前缀条件我们的使用两个数据集训练的和模型相比仅使用或训练的模型的零样本分类精度。
测试时间前缀研究下表描述了测试期间使用的前缀的性能变化。我们证明通过使用与分类数据集相同的前缀提示分类数据集的性能得到缓存是计算机科学中普遍存在的想法它根据请求 美国手机数据列表 模式将流行项目的子集存储在更靠近客户端的位置从而显着提高存储和检索系统的性能。缓存管理的一个重要算法部分是用于动态更新所存储的项目集的决策策略该决策策略在几十年来已经得到了广泛优化从而产生了多种高效且强大的启发式方法。尽管近年来将机器学习应用于缓存策略例如存储应用已显示出可喜的结果但以一种能够可靠地超越基准到生产设置的方式超越稳健的启发式方法同时保持计算竞争力仍然是一个挑战和内存开销。

在上提出的内容交付网络的启算法它使用随机化将轻量级启发式基线驱逐规则与学习奖励模型合并。奖励模型是轻量级的神经网络通过持续的偏好比较自动反馈进行持续训练旨在模仿离线预言机。我们讨论如何提高内容交付网奖励。的这一方面类似于人类反馈强化学习系统但有两个重要区别反馈是自动化的并利用有关离线最佳缓存逐出策略结构的众所周知的结果。该模型是使用从自动反馈过程构建的训练示例的瞬时缓冲区来连续学习的。驱逐决定依赖于包含两个步骤的过滤机制。首先使用高效但性能欠佳的启发式方法选择一小部分候选者。然后重新排序步骤通过少量使用神经网络评分函数从基线候选中进行优化以提高最终决策的质量。