Zur Wunschliste hinzufügenZur Wunschliste hinzugefügtVon Wunschliste entfernt -1
Segment

Das erste Netzwerk für benutzereigene Daten

Wir glauben an ein offenes Internet, in dem die Nutzer/innen Eigentümer/innen ihrer Daten und der KI-Modelle sind, zu denen sie beitragen. KI-Modelle sollten eher wie Open-Source-Software erstellt werden: iterativ durch eine Community. Um dies zu ermöglichen, brauchen Forscher/innen Zugang zu den besten Datensätzen der Welt, die in Walled Gardens gefangen gehalten werden. Die Nutzer können diese Walled Gardens aufbrechen, indem sie ihre eigenen Daten exportieren. Wir arbeiten an einem nutzergetragenen Stiftungsmodell, das von 100 Millionen Nutzern entwickelt wird, die ihre Daten und Berechnungen beisteuern.

Schreiben Sie eine Bewertung
Verkauft von
Yippy
@ Yip Ster

Das Startup Vana will, dass Nutzer für ihre Trainingsdaten bezahlt werden

Nutzer können ihre Daten für KI-Training vermieten

Im Boom der generativen KI sind Daten das neue Öl. Warum solltest du also nicht auch deine eigenen verkaufen können?

VANA – Über uns

 

Vana’s Plattform

Vana hat sich zum Ziel gesetzt, eine Plattform zu schaffen, auf der die Nutzer/innen ihre Daten – Chats, Sprachaufnahmen und Fotos – zu Datensätzen für das Training generativer KI-Modelle zusammenführen können. Durch die Feinabstimmung der öffentlichen Modelle auf Basis der Nutzerdaten sollen personalisierte Erlebnisse geschaffen werden, wie z. B. tägliche Motivations-Sprachnachrichten, die auf Wellness-Zielen basieren, oder kunstgenerierende Apps, die Stilvorlieben erkennen.

Was ist die Motivation?

Von großen Tech-Firmen bis hin zu Start-ups lizenzieren KI-Entwickler/innen E-Books, Bilder, Videos, Audiodateien und vieles mehr von Datenbrokern, um leistungsfähigere (und rechtlich vertretbare) KI-gestützte Produkte zu trainieren. Shutterstock zum Beispiel hat Vereinbarungen mit Meta, Google, Amazon und Apple getroffen, um Millionen von Bildern für das Training von Modellen zur Verfügung zu stellen, während OpenAI mit mehreren Nachrichtenorganisationen Verträge zur Nutzung ihrer Nachrichtenarchive abgeschlossen hat. In vielen Fällen haben die einzelnen Ersteller und Eigentümer dieser Daten nichts von den Gewinnen mitbekommen. Vana will das ändern.

Die Gründung von Vana

Anna Kazlauskas und Art Abal gründeten Vana im Jahr 2021, nachdem sie sich in einem Kurs am MIT Media Lab kennengelernt hatten, der sich mit der Entwicklung von Technologien für Schwellenländer beschäftigte. Vor Vana studierte Kazlauskas Informatik und Wirtschaftswissenschaften am MIT und gründete über Y Combinator das Startup Iambiq, ein Unternehmen für Finanzautomatisierung. Abal, ein gelernter Unternehmensjurist, war Mitarbeiter bei The Cadmus Group, bevor er den Bereich Impact Sourcing beim Datenverarbeitungsunternehmen Appen leitete.

Vana’s API

Die Vana API verbindet die persönlichen Daten der Nutzer/innen plattformübergreifend, um Anwendungen zu personalisieren. Dieser Zugang ermöglicht es Apps, das personalisierte KI-Modell oder die zugrunde liegenden Daten eines Nutzers zu verwenden, was das Onboarding vereinfacht und die Kosten für die Datenverarbeitung reduziert. Vana ist der Meinung, dass Nutzer/innen in der Lage sein sollten, ihre Daten von Plattformen wie Instagram, Facebook und Google mitzubringen, um von der ersten Interaktion mit einer KI-Anwendung an personalisierte Erfahrungen zu schaffen.

Ein Konto erstellen

Die Erstellung eines Kontos bei Vana ist ganz einfach. Nachdem du deine E-Mail bestätigt hast, kannst du Daten an einen digitalen Avatar anhängen (z. B. Selfies, Beschreibungen deiner Person und Sprachaufnahmen) und Apps erkunden, die auf der Plattform und den Datensätzen von Vana basieren. Diese Apps reichen von Chatbots im Stil von ChatGPT über interaktive Geschichtenbücher bis hin zu einem Hinge-Profilgenerator.

Bedenken hinsichtlich des Datenschutzes

Warum sollte jemand in der aktuellen Situation des erhöhten Datenschutzbewusstseins und der Ransomware-Angriffe seine persönlichen Daten einem anonymen Startup zur Verfügung stellen, vor allem wenn es von einem Risikokapitalgeber unterstützt wird? Vana hat 20 Millionen US-Dollar von Paradigm, Polychain Capital und anderen erhalten. Kann man sich darauf verlassen, dass ein gewinnorientiertes Unternehmen seine Daten nicht missbraucht oder falsch handhabt? Kazlauskas betonte, dass Vana darauf abzielt, dass die Nutzer/innen „die Kontrolle über ihre Daten zurückgewinnen“. Die Nutzer/innen können ihre Daten selbst hosten, anstatt sie auf den Servern von Vana zu speichern, und kontrollieren, wie ihre Daten mit Apps und Entwicklern geteilt werden. Vana verdient Geld, indem es von den Nutzern ein monatliches Abonnement ab 3,99 US-Dollar verlangt und von den Entwicklern eine„Datentransaktionsgebühr“ erhebt, um die Ausbeutung der Nutzerdaten zu verhindern. „Wir wollen Modelle erstellen, die den Nutzern gehören und von ihnen verwaltet werden, die ihre Daten beisteuern“, sagt Kazlauskas, „so dass die Nutzer ihre Daten und Modelle in jede Anwendung mitnehmen können.“

Reddit

Reddit Daten DAO

Vana verkauft die Daten der Nutzer/innen nicht an Unternehmen, um KI-Modelle zu trainieren, sondern will es den Nutzer/innen ermöglichen, dies selbst zu tun, wenn sie es wünschen, angefangen bei ihren Reddit-Beiträgen. Diesen Monat hat Vana die Reddit Data DAO (Digital Autonomous Organization) ins Leben gerufen, die Reddit-Daten mehrerer Nutzer/innen (einschließlich Karma und Posting-Historie) zusammenführt und ihnen die Möglichkeit gibt, gemeinsam zu entscheiden, wie die kombinierten Daten verwendet werden. Nutzer/innen können sich mit einem Reddit-Account anmelden, ihre Daten von Reddit anfordern und in die DAO hochladen, um dann über Entscheidungen wie die Lizenzierung der Daten an KI-Unternehmen zur gemeinsamen Nutzung abzustimmen. Diese Initiative ist eine Reaktion auf die jüngsten Schritte von Reddit, die Daten auf der Plattform zu kommerzialisieren. Reddit, das anfangs den Zugang zu Beiträgen für das KI-Training nicht zuließ, hat diese Politik Ende letzten Jahres vor seinem Börsengang geändert und über 203 Millionen Dollar an Lizenzgebühren von Unternehmen wie Google eingenommen.

Die Reaktion von Reddit

Reddit arbeitet nicht offiziell mit Vana zusammen und ist unzufrieden mit der DAO. Reddit hat das Subreddit von Vana verboten und wirft Vana vor, sein Datenexportsystem auszunutzen, das Vorschriften wie GDPR und den California Consumer Privacy Act erfüllt. Ein Reddit-Sprecher betonte, dass die Datenvereinbarungen Leitplanken enthalten, um Missbrauch zu verhindern, und betonte, dass Reddit keine nicht-öffentlichen, persönlichen Daten mit kommerziellen Unternehmen teilt.

Vana’s DAO Zukunft

Kazlauskas stellt sich vor, dass die DAO wächst und sich auf die Höhe der Gebühren auswirkt, die Reddit für seine Daten verlangen kann. Mit nur 141.000 Mitgliedern bei 73 Millionen Reddit-Nutzern hat die DAO jedoch noch einen langen Weg vor sich. Auch die Verteilung der Zahlungen von Datenkäufern ist eine Herausforderung. Derzeit vergibt die DAO Kryptowährungstoken, die dem Reddit-Karma der Nutzer/innen entsprechen, aber das Karma ist vielleicht nicht der beste Maßstab für die Datenqualität. Kazlauskas schlägt vor, dass die Mitglieder plattformübergreifende und demografische Daten austauschen könnten, um den Wert der DAO zu erhöhen und Anreize für Anmeldungen zu schaffen, aber das erfordert mehr Vertrauen in die Datenverarbeitung von Vana.

Yippy
Logo