El potencial de la pista de datos de IA y el surgimiento de Web3 DataFi
En una época en la que el mundo compite por construir los mejores modelos fundamentales, la capacidad de cálculo y la arquitectura del modelo son sin duda importantes, pero la verdadera ventaja competitiva son los datos de entrenamiento. El evento más destacado en el círculo de la IA este mes fue la demostración de fuerza de Meta, que formó un lujoso equipo de IA compuesto principalmente por talentosos investigadores de origen chino. El líder es Alexander Wang, de solo 28 años, quien fundó Scale AI. Scale AI actualmente tiene una valoración de 29 mil millones de dólares y proporciona servicios de datos a varias grandes empresas de IA, incluyendo las fuerzas armadas de EE. UU., OpenAI, Anthropic y Meta.
La razón por la que Scale AI ha podido destacarse entre muchos unicornios es que se dio cuenta temprano de la importancia de los datos en la industria de la IA. La potencia de cálculo, los modelos y los datos son los tres pilares de los modelos de IA. Si comparamos un gran modelo con una persona, el modelo sería el cuerpo, la potencia de cálculo sería la comida y los datos serían el conocimiento y la información.
Con el rápido desarrollo de LLM, el enfoque de la industria ha ido cambiando gradualmente de los modelos a la potencia de cálculo. Hoy en día, la mayoría de los modelos han establecido el transformer como marco. Los grandes actores han construido sus propios clústeres de supercomputación o han firmado acuerdos a largo plazo con proveedores de servicios en la nube. Después de satisfacer las necesidades básicas de potencia de cálculo, la importancia de los datos se ha vuelto cada vez más evidente.
Scale AI no solo se dedica a la extracción de datos existentes, sino que también pone la mirada en un negocio de generación de datos a largo plazo. La empresa está intentando proporcionar datos de entrenamiento de mayor calidad para modelos de IA a través de equipos de expertos humanos en diferentes campos.
El entrenamiento del modelo se divide en dos etapas: preentrenamiento y ajuste fino. El preentrenamiento es similar al proceso de aprender a hablar de un bebé, que requiere una gran cantidad de información extraída de textos, códigos, etc., de Internet. El ajuste fino es como la educación escolar, que tiene un objetivo y dirección claros. Correspondientemente, los datos necesarios también se dividen en dos categorías: una categoría es una gran cantidad de datos que no requieren mucho procesamiento, mientras que la otra necesita un diseño y selección cuidadosos para desarrollar habilidades específicas del modelo.
A medida que las capacidades del modelo continúan mejorando, diversos conjuntos de datos de entrenamiento más finos y especializados se convertirán en factores clave que influyen en la capacidad del modelo. A largo plazo, los datos de IA también son un campo que tiene un efecto de bola de nieve; a medida que se acumula el trabajo inicial, los activos de datos tendrán la capacidad de interés compuesto, volviéndose más valiosos con el tiempo.
Web3 DataFi: El terreno ideal para los datos de IA
En comparación con las empresas de datos tradicionales, Web3 tiene ventajas naturales en el campo de los datos de IA, lo que ha dado lugar a un nuevo concepto llamado DataFi. Las ventajas de Web3 DataFi se reflejan principalmente en los siguientes aspectos:
Los contratos inteligentes garantizan la soberanía de los datos, la seguridad y la privacidad
La arquitectura distribuida atrae a la mano de obra más adecuada del mundo.
Mecanismos claros de incentivos y liquidación en blockchain
Construir un mercado de datos de una sola parada, eficiente y abierto.
Para los usuarios comunes, DataFi es el proyecto de IA descentralizada más fácil de participar. Los usuarios no necesitan una inversión en hardware costoso ni un fondo técnico profesional, solo necesitan participar a través de tareas simples, como proporcionar datos, evaluar los resultados del modelo, etc.
Proyectos potenciales de Web3 DataFi
Actualmente, varios proyectos de DataFi han obtenido una financiación considerable, mostrando un gran potencial:
Sahara AI: Comprometido a construir una infraestructura de IA descentralizada y un mercado de transacciones.
Yupp: plataforma de retroalimentación de modelos de IA, los usuarios pueden evaluar la calidad de salida de diferentes modelos.
Vana: Convierte los datos personales de los usuarios en activos digitales monetizables.
Chainbase: Enfocado en datos en cadena, cubriendo más de 200 cadenas de bloques.
Sapien: Transformar el conocimiento humano en datos de entrenamiento de IA de alta calidad
Prisma X: Capa de coordinación abierta para robots, centrada en la recolección de datos físicos
Masa: Proyecto principal de subred del ecosistema Bittensor, que proporciona acceso a datos en tiempo real.
Irys: Enfocado en el almacenamiento y cálculo de datos programables
ORO: Empoderar a las personas comunes para participar en la contribución de IA
Gata: capa de datos descentralizada que ofrece diversas herramientas de recolección y procesamiento de datos.
Aunque estos proyectos actualmente no tienen una alta barrera de entrada, las ventajas de la plataforma se formarán rápidamente a medida que se acumule el número de usuarios y la adherencia al ecosistema. En las etapas iniciales, se debe prestar especial atención a las medidas de incentivo y a la experiencia del usuario para atraer a suficientes usuarios. Al mismo tiempo, el equipo del proyecto necesita considerar cómo gestionar el trabajo humano y garantizar la calidad de los datos, evitando así la situación en la que la mala moneda expulsa a la buena.
Además, mejorar la transparencia y acelerar el proceso de descentralización son también importantes desafíos que enfrentan estos proyectos. La adopción masiva de DataFi requiere atraer tanto a usuarios individuales como a clientes empresariales convencionales, formando un ciclo ecológico completo.
DataFi representa el proceso en el que la inteligencia humana cultiva a largo plazo la inteligencia de las máquinas, mientras que garantiza los beneficios del trabajo humano a través de contratos inteligentes. Para aquellos que están llenos de expectativas hacia la era de la IA y mantienen ideales de blockchain, participar en DataFi es sin duda una elección sabia que sigue la tendencia.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
5 me gusta
Recompensa
5
3
Republicar
Compartir
Comentar
0/400
GateUser-40edb63b
· hace7h
A los 28 años ya tiene 29 mil millones. Si tienes talento, no seas joven.
Ver originalesResponder0
StablecoinEnjoyer
· hace7h
Los datos son el rey, y dependen del talento asiático.
Ver originalesResponder0
BearMarketHustler
· hace7h
los datos son la clave de la IA, ¿quién demonios juega con la potencia computacional?
Web3 DataFi: Análisis de nuevas oportunidades y proyectos potenciales en la pista de datos de IA
El potencial de la pista de datos de IA y el surgimiento de Web3 DataFi
En una época en la que el mundo compite por construir los mejores modelos fundamentales, la capacidad de cálculo y la arquitectura del modelo son sin duda importantes, pero la verdadera ventaja competitiva son los datos de entrenamiento. El evento más destacado en el círculo de la IA este mes fue la demostración de fuerza de Meta, que formó un lujoso equipo de IA compuesto principalmente por talentosos investigadores de origen chino. El líder es Alexander Wang, de solo 28 años, quien fundó Scale AI. Scale AI actualmente tiene una valoración de 29 mil millones de dólares y proporciona servicios de datos a varias grandes empresas de IA, incluyendo las fuerzas armadas de EE. UU., OpenAI, Anthropic y Meta.
La razón por la que Scale AI ha podido destacarse entre muchos unicornios es que se dio cuenta temprano de la importancia de los datos en la industria de la IA. La potencia de cálculo, los modelos y los datos son los tres pilares de los modelos de IA. Si comparamos un gran modelo con una persona, el modelo sería el cuerpo, la potencia de cálculo sería la comida y los datos serían el conocimiento y la información.
Con el rápido desarrollo de LLM, el enfoque de la industria ha ido cambiando gradualmente de los modelos a la potencia de cálculo. Hoy en día, la mayoría de los modelos han establecido el transformer como marco. Los grandes actores han construido sus propios clústeres de supercomputación o han firmado acuerdos a largo plazo con proveedores de servicios en la nube. Después de satisfacer las necesidades básicas de potencia de cálculo, la importancia de los datos se ha vuelto cada vez más evidente.
Scale AI no solo se dedica a la extracción de datos existentes, sino que también pone la mirada en un negocio de generación de datos a largo plazo. La empresa está intentando proporcionar datos de entrenamiento de mayor calidad para modelos de IA a través de equipos de expertos humanos en diferentes campos.
El entrenamiento del modelo se divide en dos etapas: preentrenamiento y ajuste fino. El preentrenamiento es similar al proceso de aprender a hablar de un bebé, que requiere una gran cantidad de información extraída de textos, códigos, etc., de Internet. El ajuste fino es como la educación escolar, que tiene un objetivo y dirección claros. Correspondientemente, los datos necesarios también se dividen en dos categorías: una categoría es una gran cantidad de datos que no requieren mucho procesamiento, mientras que la otra necesita un diseño y selección cuidadosos para desarrollar habilidades específicas del modelo.
A medida que las capacidades del modelo continúan mejorando, diversos conjuntos de datos de entrenamiento más finos y especializados se convertirán en factores clave que influyen en la capacidad del modelo. A largo plazo, los datos de IA también son un campo que tiene un efecto de bola de nieve; a medida que se acumula el trabajo inicial, los activos de datos tendrán la capacidad de interés compuesto, volviéndose más valiosos con el tiempo.
Web3 DataFi: El terreno ideal para los datos de IA
En comparación con las empresas de datos tradicionales, Web3 tiene ventajas naturales en el campo de los datos de IA, lo que ha dado lugar a un nuevo concepto llamado DataFi. Las ventajas de Web3 DataFi se reflejan principalmente en los siguientes aspectos:
Para los usuarios comunes, DataFi es el proyecto de IA descentralizada más fácil de participar. Los usuarios no necesitan una inversión en hardware costoso ni un fondo técnico profesional, solo necesitan participar a través de tareas simples, como proporcionar datos, evaluar los resultados del modelo, etc.
Proyectos potenciales de Web3 DataFi
Actualmente, varios proyectos de DataFi han obtenido una financiación considerable, mostrando un gran potencial:
Aunque estos proyectos actualmente no tienen una alta barrera de entrada, las ventajas de la plataforma se formarán rápidamente a medida que se acumule el número de usuarios y la adherencia al ecosistema. En las etapas iniciales, se debe prestar especial atención a las medidas de incentivo y a la experiencia del usuario para atraer a suficientes usuarios. Al mismo tiempo, el equipo del proyecto necesita considerar cómo gestionar el trabajo humano y garantizar la calidad de los datos, evitando así la situación en la que la mala moneda expulsa a la buena.
Además, mejorar la transparencia y acelerar el proceso de descentralización son también importantes desafíos que enfrentan estos proyectos. La adopción masiva de DataFi requiere atraer tanto a usuarios individuales como a clientes empresariales convencionales, formando un ciclo ecológico completo.
DataFi representa el proceso en el que la inteligencia humana cultiva a largo plazo la inteligencia de las máquinas, mientras que garantiza los beneficios del trabajo humano a través de contratos inteligentes. Para aquellos que están llenos de expectativas hacia la era de la IA y mantienen ideales de blockchain, participar en DataFi es sin duda una elección sabia que sigue la tendencia.