为什么开发者喜欢开源 KitOps——来自机器学习前线的经验分享

在人工智能/机器学习领域，充斥着大量吹捧最新技术创新的文章。大多数情况下，这些创新并未被应用到少数科学家之外的人群中。与此不同，我们撰写本文旨在分享一家真实公司中的真实用户如何使用 KitOps，并以简洁明了的方式解释为什么 KitOps 是唯一能够满足他们需求的解决方案。

TAR 和 S3 的愚蠢之处

首先，我们来谈谈大家心知肚明却又避而不谈的问题：TAR 文件。没错，它们的确很方便，能把你的文件打包成简洁易用的压缩包。但蜜月期也就到此为止了。一位名叫 Niklas 的用户，同时也是一家德国联邦科技公司的工程师，用只有亲身经历才能体会到的那种直言不讳，向我们揭示了 TAR 的弊端：“ S3 和 GitLFS 就像狂野西部——什么都可以做，而这恰恰是问题所在，因为它们都存在缺陷。 ”
并非防篡改：如果没有不可篡改的特性，就无法保证你的文件没有被篡改过。祝你好运，看看该如何向你的合规官解释这一点。

缺乏可听性：当需要追溯决策源头时，技术授权报告 (TAR) 和 S3 几乎帮不上什么忙。正如 Niklas 指出的，新的人工智能法规“要求确保发布文件的完整性和真实性”。如果你的文件散落在各处，未经核实且缺乏约束，又该如何做到这一点呢？

轻松标记：冠军模型与挑战者模型、语义版本控制——如果没有合适的工具，想实现这些目标几乎是不可能的。TAR 做不到，S3 也做不到。

元数据处理不当：没错，你的工件可能有个名称，但这能完整地描述它吗？那些对下游流程至关重要的额外元数据呢？
供应链不一致： “所有东西都在 Artifactory 里，”Niklas 指出，“那么为什么不把机器学习工件也存储在那里呢？”关键在于一致性，而 TAR 或 S3 都无法做到这一点。

KitOps 的力量

相比之下， KitOps不仅仅存储您的工件，还会将它们放入您现有的 OCI 镜像仓库（DockerHub、Quay.io、Artifactory、GitHub Container Registry），这些仓库已经过安全审核，并采用企业级身份验证和授权机制。现在，它们受到严密保护，而KitOps ModelKit格式确保每个字节都被记录在案，每个版本都被标记和跟踪，每个工件都像珠穆朗玛峰一样不可更改。这不仅仅是为了满足合规性要求，更是为了确保您的 AI 模型从一开始就值得信赖、可靠且安全。

为什么选择 KitOps？

防篡改：使用 KitOps，您的工件将被锁定、哈希处理并以不可更改的方式存储。您再也不用担心半夜惊醒，担心某些东西被偷偷篡改了。

可审计性：每个工件都带有完整的历史记录，确保当审计人员上门时，您不会手忙脚乱地寻找答案。

标签和版本控制： KitOps 内置了对冠军模型与挑战者模型、语义版本控制等功能的支持，使管理复杂的机器学习工作流程变得轻松。

优雅的打包： KitOps 不仅存储您的工件，还会将它们与您需要的所有元数据打包在一起，从而确保每次部署都具有一致性和可靠性。

供应链的一致性： KitOps 将所有内容存储在 Artifactory 中，确保您的 AI/ML 工作流程与 DevOps 流程的其他部分一样无缝衔接。

扩大规模

当然，如果 KitOps 无法扩展，这一切就毫无意义。但正如 Niklas 所解释的，这并非问题。他的团队目前规模虽小——只有 10 到 15 位数据科学家、工程师和 SRE，负责五个预测性机器学习模型——但他们正在不断壮大。随着团队的扩张，KitOps 也将随之扩展，确保他们的工作流程始终流畅、安全且一致，无论部署多少模型。正因如此，它才被全球一些最大的政府机构、科研实验室和科技公司所采用。

预测性机器学习，而非层级线性模型

值得注意的是，Niklas 的团队目前还没有深入研究机器学习（LLM），他们专注于预测性机器学习。但无论您是部署机器学习、微调机器学习，还是仅仅管理少量预测模型，KitOps 都能满足您的需求。当然，如果您正在开发机器学习，KitOps 就显得更加重要，因为项目工件的数量和规模只会不断增长。

底线

如果你对人工智能/机器学习认真投入，并且厌倦了那些承诺美好却实际表现糟糕的工具，那么是时候了解一下 KitOps 了。它不仅仅是存储你的工件——更重要的是确保它们的安全性、可审计性，以及随时可以部署。因为在这个领域，任何低于此标准的风险都是你无法承受的。

如果您对将 KitOps 集成到您的团队有任何疑问，请加入Discord上的讨论，并立即开始使用 KitOps！

文章来源：https://dev.to/jozu/why-devs-love-open-source-kitops-tales-from-the-ml-trenches-23pa

菜单

分享

为什么开发者喜欢开源 KitOps——来自机器学习前线的经验分享

为什么开发者喜欢开源 KitOps——来自机器学习前线的经验分享

TAR 和 S3 的愚蠢之处

KitOps 的力量

为什么选择 KitOps？

扩大规模

预测性机器学习，而非层级线性模型

底线

系统设计面试中的 19 种微服务模式

使用 React 和 AWS Amplify 实现无服务器架构第三部分：跟踪应用使用情况

模型-视图-控制器（MVC）模式到底是什么？DEV 全球项目展示挑战赛，由 Mux 主办：快来展示你的项目吧！

我在两年内从 PHP 开发人员晋升为高级 C#/.NET 开发人员。

了解 Docker：第 12 部分 – 传递构建参数

Yarn 和第三方 NPM 客户端的黑暗未来 DEV 的全球展示与讲述挑战赛，由 Mux 呈现：展示你的项目！

CSS DEV 的全球展示挑战赛“响应式字体”由 Mux 呈现：展示你的项目！

我是如何以学生开发者的身份免费获得 Tabnine Pro 的，你也可以！

五大顶级JS框架

从 Rector PHP 开始：利用自动化改进您的 PHP 代码