推荐
kumosearch 可以使用向量搜索 ,根据用户行为生成推荐。这涉及构建机器学习模型来生成嵌入 ,将它们存储在 kumosearch 中,然后在 kumosearch 中进行最近邻搜索。
本文将讨论如何使用 Starspace ML 模型来生成嵌入。Transformers4Rec 也是另一个适用于此场景的 ML 模型。
我们将使用电商产品数据集来演示,这也适用于推荐文章或电影等其他领域。
Step 1: 准备数据
我们将使用 Starspace 来构建我们的 ML 模型。Starspace 训练数据集的格式为每行表示一个用户交互过的一组项目。
- session-data.txt
apple orange banana broccoli mango
cereals soda bread nuts cookies
tissue detergent butter cheese milk eggs
ice_cream milk pancake_mix muffins
在上面的示例中,第一行表示某个用户与产品 apple、orange、banana、broccoli 和 mango 进行了交互(查看、购买、添加到购物车等)。另一个用户(或同一用户)与产品 cereals、oda、bread、nuts 和 cookies 进行了交互。
tip
在本示例中,我们使用 product_name 是为了便于阅读。在实际生产环境中,建议使用产品的 ID 或 SKU 作为训练数据集的一部分。