Datos descentralizados de IA de OORT alcanzaron los primeros puestos en Kaggle de Google

Cripto noticiasHace un día20 Vistas


Un conjunto de datos de imágenes de entrenamiento de inteligencia artificial desarrollado por el proveedor descentralizado de soluciones de IA OORT ha cosechado un éxito considerable en la plataforma Kaggle de Google.

El conjunto de datos Diverse Tools Kaggle de OORT se publicó a principios de abril y, desde entonces, ha escalado hasta la primera página en varias categorías. Kaggle es una plataforma en línea propiedad de Google para competiciones de ciencia de datos y aprendizaje automático, aprendizaje y colaboración.

Ramkumar Subramaniam, colaborador principal en el proyecto de cripto IA OpenLedger, dijo a Cointelegraph que “una clasificación de Kaggle en la primera página es una fuerte señal social, lo que indica que el conjunto de datos está involucrando a las comunidades adecuadas de científicos de datos, ingenieros de aprendizaje automático y profesionales”.

Max Li, fundador y CEO de OORT, dijo a Cointelegraph que la firma “observó métricas de compromiso prometedoras que validan la demanda temprana y la relevancia” de sus datos de entrenamiento recopilados a través de un modelo descentralizado. Y añadió:

“El interés orgánico de la comunidad, incluido el uso activo y las contribuciones, demuestra cómo las canalizaciones de datos descentralizadas e impulsadas por la comunidad como la de OORT pueden lograr una rápida distribución y compromiso sin depender de intermediarios centralizados”.

Li también dijo que OORT tiene previsto publicar varios conjuntos de datos en los próximos meses. Entre ellos, un conjunto de datos sobre comandos de voz en automóviles, otro sobre comandos de voz en hogares inteligentes y otro sobre vídeos falsos para mejorar la verificación de medios con IA.

Primera página en varias categorías

Cointelegraph verificó de forma independiente que el conjunto de datos en cuestión había alcanzado la primera página en las categorías de IA general, comercio minorista y compras, fabricación e ingeniería de Kaggle a principios de este mes. En el momento de la publicación, perdió esas posiciones tras una actualización del conjunto de datos posiblemente no relacionada el 6 de mayo y otra el 14 de mayo.

Conjunto de datos de OORT en la primera página de Kaggle de la categoría Ingeniería. Fuente: Kaggle

Aunque reconoció el logro, Subramaniam dijo a Cointelegraph que “no es un indicador definitivo de la adopción en el mundo real o de la calidad de grado empresarial”. Dijo que lo que distingue al conjunto de datos de OORT “no es sólo la clasificación, sino la procedencia y la capa de incentivos detrás del conjunto de datos”. Explicó:

“A diferencia de los proveedores centralizados, que pueden basarse en canales opacos, un sistema transparente e incentivado por tokens ofrece trazabilidad, curación comunitaria y la posibilidad de una mejora continua, siempre que se cuente con la gobernanza adecuada”.

Lex Sokolin, socio de la firma de capital de riesgo de IA Generative Ventures, dijo que si bien no cree que estos resultados sean difíciles de replicar, “muestra que los criptoproyectos pueden usar incentivos descentralizados para organizar una actividad económicamente valiosa”.

Datos de entrenamiento de IA de alta calidad: un bien escaso

Los datos publicados por la firma de investigación de IA Epoch AI estiman que los datos de entrenamiento de IA de texto generados por humanos se agotarán en 2028. La presión es lo suficientemente alta como para que los inversores estén mediando en acuerdos que conceden derechos sobre materiales protegidos por derechos de autor a empresas de IA.

Hace años que circulan informes sobre la creciente escasez de datos de entrenamiento de IA y sobre cómo puede limitar el crecimiento de este sector. Aunque los datos sintéticos (generados por la IA) se utilizan cada vez más, al menos con cierto éxito, los datos humanos siguen considerándose en gran medida la mejor alternativa, los datos de mayor calidad que conducen a mejores modelos de IA.

En lo que respecta a las imágenes para el entrenamiento de la IA, las cosas se están complicando cada vez más, ya que los artistas sabotean los esfuerzos de entrenamiento a propósito. Nightshade permite a los usuarios “envenenar” sus imágenes y degradar gravemente el rendimiento del modelo.

Rendimiento del modelo según el número de imágenes contaminadas. Fuente: TowardsDataScience

Subramaniam afirmó: “Estamos entrando en una era en la que los datos de imágenes de alta calidad serán cada vez más escasos”. También reconoció que esta escasez se agrava por la creciente popularidad del envenenamiento de imágenes:

“Con el auge de técnicas como el encubrimiento de imágenes y las marcas de agua adversarias para envenenar el entrenamiento de la IA, los conjuntos de datos de código abierto se enfrentan a un doble desafío: cantidad y confianza”.

En esta situación, Subramaniam afirmó que los conjuntos de datos verificables, incentivados y de origen comunitario son “más valiosos que nunca”. Según él, estos proyectos “pueden convertirse no solo en alternativas, sino en pilares de la alineación y la procedencia de la IA en la economía de datos”.

Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión.

Las inversiones en criptoactivos no están reguladas. Es posible que no sean apropiados para inversores minoristas y que se pierda el monto total invertido. Los servicios o productos ofrecidos no están dirigidos ni son accesibles a inversores en España.



Source link

0 Votes: 0 Upvotes, 0 Downvotes (0 Points)

Contesta

Sintoniza la radio que combina las noticias deportivas con música ideal para ti



Escucha la radio que toca el deporte

Orienta y guía nuestra labor

Guarda tu lengua del mal y tus labios de hablar engaño. Apártate del mal y haz el bien. Busca la paz y síguela.

Salmo 34

Mantente informado con las últimas y más importantes noticias

Acepto recibir el boletín informativo por correo electrónico. Para más información, consulta nuestra. Política de privacidad

Publicidad

Cargando Siguiente publicación...
Seguir
Barra lateral Buscar
Popular hoy
Carga

Signing-in 3 seconds...

Signing-up 3 seconds...