kumosearch 使用案例
我们构建 kumosearch 作为一个快速、容错的AI搜索引擎,并不断改进以支持更多应用场景。
正确用例
以下是不断扩展中的 kumosearch 使用案例列表:
- 容错的模糊搜索:支持自动完成搜索栏和搜索结果页面。
- 相似性搜索:使用矢量搜索查找相似文档,“相似性”的定义可以通过您的任何 ML 模型来确定。通过 kumosearch,您可以实现个性化推荐、视觉搜索、语义搜索等功能。
- 语义搜索:用户输入概念相关的关键词时,即使确切的关键词不存在,kumosearch 也能从数据集中返回相关结果。例如,用户搜索
ocean,但数据集中只有sea,语义搜索仍能检索到相关结果。 - RAG对话搜索: kumosearch 的矢量和混合搜索功能使得如 ChatGPT 等 LLM 大语言模型可以使用 JSON 数据集中的信息进行响应,支持对话式聊天机器人开发。
- 分面导航:用户可以直接应用过滤器,而无需输入关键字,以多属性筛选他们所寻找的文档。
- 联合搜索:跨多个索引执行搜索,并将结果并排显示给用户。
- 地理搜索:按接近特定纬度/经度的记录进行搜索和排序。
- 多租户搜索:某些记录或字段仅对特定用户组可见,如登录用户、管理员或特定定价计划的用户。
- 多地分布式缓存:将数据存储在靠近用户的位置。您可以直接从相应 kumosearch 集群中获取文档,而无需访问可能位于单一地理区域的主数据库,从而减少延迟。
- 数据可视化:使用 kumosearch 返回的聚合指标支持图表和表格等数据可视化。
错误用例
以下是我们不建议您使用 kumosearch 的情况:
-
主数据存储:kumosearch 不应被用作主数据存储。kumosearch 设计为辅助数据存储。这意味着 您应使用其他主数据库来存储数据的主副本,并将数据副本同步到 kumosearch,以支持上述用例。
-
日志存储:kumosearch 通常不适合存储应用程序日志。日志数量庞大,存储在 RAM 中的成本可能过高。此外,日志通常不需要 kumosearch 优化的即时搜索体验。不过,一些用户希望在用户界面中公开部分用户生成的日志供搜索或浏览,kumosearch 可用于此类专门的终端用户搜索场景。