Foresight News

Posted on Mar 26, 2024Read on Mirror.xyz

AI 开发者突围?Masa 的去中心化 AI 数据网络浮出水面

AI 战局拥挤,Masa 的全球最大用户「专有」数据网络,会成为初创公司的「护城河」么?

撰文:Masa
编译:Coolman,Foresight News

过去一年,人工智能的野蛮生长吸引了全世界最顶尖的开发者参与到了这场人类历史上也许最激动人心的技术革命浪潮之中。

每过几个月,我们都能看到一个新的 GPT 或大型语言模型(LLMs)发布,而其强大程度总能够「秒杀」上一个版本,更令人惊叹的是,这种技术更新的速度还在变得越来越快。然而,当我们深入了解这些 LLMs 的内部结构时,我们发现了一个对于所有 AI 从业者必须要思考的问题:AI 模型之间的竞争差距正在迅速缩小。你在 AI 方面的护城河是什么?AI 开发者该如何从这个搏杀愈发激烈的红海中脱颖而出?

举个例子来说,Anthropic 的 Claude 和 OpenAI 的 ChatGPT 等 AI 模型正在接近同等水平。而那些由数千家初创公司推出的 AI 应用程序不断被大型 AI 科技公司通过每次功能更新所颠覆。差距在缩小,模型的训练成本在降低,所有的模型都在使用相同的公开抓取的数据集进行训练,这使得脱颖而出变得越来越困难。

但是,如果我们告诉你有一个完全新颖、专属、用户生成的数据集可以用来训练 AI,事情是不是就不一样了?而这就是 Masa。

AI 时代的创新「专有」数据集

Masa 依托于「用户驱动」这个概念获得了打造 AI 竞争护城河的核心资源:专属、高质量、经过验证的个人数据。Masa 设计了一种独特的方式来收集用于训练 AI 模型的专属用户数据——通过让我们的用户成为数据挖掘者和贡献者。

用户可以通过在 Masa 应用程序上参与任务、使用 Masa Google Chrome 扩展程序浏览互联网,或在 Masa 合作伙伴生态系统中简单地度过他们的数字生活,轻松地将数据贡献给 Masa 网络。此外,每个用户都可以使用 Masa Google Chrome 扩展程序成为数据抓取者。Masa Oracle Network 作为去中心化的网络数据抓取器,可以无缝地从网站、Twitter 流、经过身份验证的站点等提取文本,并将其输入到我们的向量数据库中。

Masa 在后台汇总用户的庞大数字足迹——包括用户的历史记录、偏好和行为——超越传统的公开可用数据。Masa 网络通过其发明的 ZK Soulbound Token 使数据保持私密和安全,同时赋予用户分享和从其个人数据中获利的权力。

开发人员可以通过在 Masa 网络上设置数据质押池来轻松访问此强大的数据集,直接奖励选择共享其数据的用户。开发人员可以使用这些数据来训练「专业化」而非「通用化」的 AI 模型,创建高度个性化的 AI 代理、AI 助手等。

这个专属且结构化的数据集可以驱动真正独特、有价值且强大的 AI 应用程序,这些应用程序在其他地方无法获得。通过专注于扩大数据聚合的广度和深度,Masa 为开发人员提供了在专属、高度个性化和不断增长的数据网络上训练 AI 的能力,这可以带来 AI 中的竞争优势。

实时和去中心化的数据访问

此外,Masa 正在将大型语言模型本身去中心化。使开发人员能够访问和微调一系列开源 LLMs,而无需复杂的模型托管。通过 Masa 的 Oracle Network 节点运营商提供与 OpenAI 兼容的 API 和最新的模型,具有高可用性。

传统上,AI 模型只能根据最后一次更新检索数据和信息。这通常会导致对已经过时的信息的问题产生一般性的回答。

Masa 的去中心化 LLMs 将使开发人员能够在数据网络中进行实时搜索。每天有数百万用户向网络提供数据——这为检测趋势、做出预测甚至形成情感分析提供了一种独特的数据方法。

去中心化的数据访问允许 LLMs 在网络中评估加密数据以得出结论或呈现结果,而无需揭示网络中存储的任何敏感或个人信息。

小结

Masa 正在构建一种真正独特的 AI 训练方法,通过让开发人员在独特且专属的结构化数据集上构建,有望引领 AI 浪潮中新一轮创新趋势。

通过将数据网络访问去中心化,确保数据保持加密、私密和安全,同时提供实时数据结果和为应用程序提供现成的去中心化大型语言模型。

Masa 在 AI 领域构建了最独特的数据护城河之一,并有望颠覆 AI 的权力和价值动态。Masa 主网计划将于 4 月 11 日左右上线,目前生态用户已超过 130 万。