Inari libera todo el potencial de las semillas con una plataforma impulsada por IA
- Experiencias de éxito
La empresa de SEEDesign, Inari Agriculture, eligió a Crayon para diseñar y construir una plataforma de datos y aprendizaje automático en Amazon Web Services que impone coherencia de extremo a extremo en sus experimentos genómicos y gobernanza de datos.
Inari Agriculture es una de las empresas más interesantes y prometedoras del mundo en tecnología agrícola. El objetivo general de Inari es permitir que los productores de los tipos de cultivos más grandes del mundo resistan los impactos de un clima cambiante y ayuden a transformar la sostenibilidad del sistema alimentario mundial.
Combinando el diseño predictivo impulsado por IA con la edición de genes multiplex, la empresa busca aumentar los rendimientos de los cultivos de trigo, soja y maíz hasta en un 20%, al tiempo que se reduce el uso de fertilizantes nitrogenados y agua en el maíz en un 40%. En otras palabras, producir más utilizando significativamente menos tierra, agua y nitrógeno. Estos objetivos ilustran la magnitud de su tarea.
Superación de desafíos: unificación del aprendizaje automático y control de datos complejos
Inari utiliza el aprendizaje automático para "experimentar" en las plantas a través de la plataforma tecnológica SEEDesign, propiedad de la empresa.
"Somos una organización muy diversa, con ingenieros de software, científicos de aprendizaje automático, genetistas de maíz, fitomejoradores y muchos otros expertos en su campo, todos utilizando la ciencia de datos y el aprendizaje automático para diferentes fines. Uno de los desafíos a los que nos enfrentamos fue la falta de conocimiento central o de una forma compartida y coherente de realizar nuestros experimentos de ML", explica Alex Frieden, director de ingeniería de Inari.
El segundo desafío fueron los datos: su linaje, complejidad, formato y gran volumen. La genética de las plantas es asombrosamente compleja. Por ejemplo, solo el genoma del trigo es cinco veces más grande que el genoma humano.
"Los roles estaban fragmentados, pero también lo estaban los datos", apunta Frieden. "Cada uno tenía su propia forma de organizar experimentos utilizando diferentes herramientas y conjuntos de datos. Los datos procedían de muchos lugares con información muy diferente a la que teníamos a su alrededor: nuestra propia investigación, laboratorios universitarios, datos públicos, datos comprados, etc. Usamos una herramienta llamada Quilt para rastrear el linaje de datos, pero no se usó de manera sistemática”.
Inari necesitaba imponer una forma más uniforme y automatizada de hacer su investigación en ciencia de datos y ML. “La forma en que lo llevábamos a cabo requería mucho tiempo y la ineficiencia del proceso aumentaba los costos. Pero, lo más importante, estaba empezando a obstaculizar el camino de la ciencia, porque los experimentos no eran repetibles y carecían de visibilidad operativa, lo que significaba que los resultados eran difíciles de comparar", añade Frieden.
Asociación Crayon: Acelerar la investigación, mejorar la ciencia y fomentar la innovación
Inari habló con varios socios potenciales, pero optó por Crayon. "Nos gustaron nuestras conversaciones con el equipo de Crayon AI. Realmente nos convencieron de que tenían el conocimiento más profundo", asegura Frieden.
¿La tarea? Diseñar una plataforma que estableciera la gobernanza de extremo a extremo de los conjuntos de datos, impusiera herramientas de flujo de trabajo unificadas en Inari y democratizara el aprendizaje automático. "Desde nuestras primeras conversaciones hasta que una plataforma de ML está en producción, no pasaron más de nueve meses", afirma Frieden. Lo único no negociable de Inari era que la plataforma se construyera sobre AWS.
En el núcleo de la arquitectura de la plataforma se encuentra Databricks junto con herramientas como Quilt para metadatos y linaje, Airflow para la orquestación del flujo de trabajo y MLFlow para MLOps. "Databricks aporta muchos beneficios importantes", explica Frieden. "Es una plataforma escalable que potencia las mejores prácticas, lo que produce una reducción masiva de los tiempos de ejecución del flujo de trabajo".
La transformación de datos, que solía llevar tanto tiempo y computación, ahora se produce con solo pulsar un interruptor. La complejidad para los científicos de Inari es mucho menor, y el análisis de ML se ejecuta mucho, mucho más rápido.
Como parte de la implementación de la plataforma, Crayon ejecutó tres proyectos de Inari en la nueva plataforma. "Fue difícil comparar los resultados de Crayon con los resultados anteriores porque no ejecutamos nuestros proyectos de manera uniforme. El problema de las comparaciones estandarizadas fue en realidad una de las razones por las que necesitábamos la plataforma Crayon en primer lugar. Sin embargo, no hay duda de que estamos viendo aumentos extraordinarios en la velocidad", añade Frieden. "Un análisis 'limpio' de igual a igual vio a la plataforma Crayon completar un experimento que solía llevarnos 24 horas en tan solo 20 minutos”.
Frieden cree que la plataforma Crayon no solo ha proporcionado una investigación más rápida y menos costosa, sino también una mejor ciencia. "Anteriormente, nuestros experimentos carecían de visibilidad. Y debido a que se ejecutaban de manera inconsistente, con datos que no se podían rastrear correctamente, el análisis de los resultados podía ser frustrante", recalca.
Contacta con Crayon
INFORMACIÓN PROTECCIÓN DE DATOS DE IT DIGITAL MEDIA GROUP
Finalidades: Envío de nuestro boletín comercial y de comunicaciones informativas y publicitarias sobre nuestros productos o servicios que sean de su interés, incluso por medios electrónicos, y cesión a Crayon para que pueda contactar con usted. Legitimación: Consentimiento del interesado. Destinatarios: No están previstas cesiones de datos. Derechos: Puede retirar su consentimiento en cualquier momento, así como acceder, rectificar, suprimir sus datos y demás derechos en crayon@itdmgroup.es. Información Adicional: Puede ampliar la información en el enlace de Política de Privacidad.