En Awtana, nos enorgullecemos de estar siempre a la vanguardia de las últimas tendencias y noticias en tecnología. Hoy, queremos compartir una noticia emocionante que está causando revuelo en el mundo de la inteligencia artificial y el desarrollo de software. Mistral, la startup francesa de IA respaldada por Microsoft y valorada en $6 mil millones, ha lanzado su primer modelo generativo de IA para codificación, denominado Codestral.
En este blog, exploraremos lo que hace especial a Codestral y cómo podría impactar el futuro del desarrollo de software.
Codestral es un modelo de IA diseñado para ayudar a los desarrolladores a escribir y gestionar código. Fue entrenado en más de 80 lenguajes de programación, incluidos Python, Java, C++ y JavaScript, según explica Mistral en una publicación en su blog. Este modelo no solo puede completar funciones de codificación y escribir pruebas, sino que también puede "llenar" código parcial y responder preguntas sobre una base de código en inglés.
Sin embargo, la apertura de Codestral es un tema debatible. Aunque Mistral describe el modelo como "abierto", la licencia prohíbe el uso de Codestral y sus resultados para actividades comerciales. Hay una excepción para el "desarrollo", pero incluso eso tiene sus limitaciones: la licencia prohíbe explícitamente "cualquier uso interno por parte de empleados en el contexto de las actividades comerciales de la empresa". La razón detrás de estas restricciones podría ser que Codestral fue entrenado en parte con contenido protegido por derechos de autor. Mistral no confirmó ni negó esto en su blog, pero hay indicios de que los conjuntos de datos de entrenamiento anteriores de la startup contenían datos protegidos por derechos de autor.
En cualquier caso, Codestral puede no valer la pena el esfuerzo. Con 22 mil millones de parámetros, el modelo requiere una PC potente para funcionar. (Los parámetros definen esencialmente la habilidad de un modelo de IA para analizar y generar texto). Y aunque supera a la competencia según algunos benchmarks (que, como sabemos, no siempre son fiables), no es una victoria aplastante.
A pesar de estas limitaciones, Codestral seguramente alimentará el debate sobre la sabiduría de confiar en modelos generativos de código como asistentes de programación. Los desarrolladores están adoptando herramientas de IA generativa para al menos algunas tareas de codificación. En una encuesta de Stack Overflow de junio de 2023, el 44% de los desarrolladores dijeron que utilizan herramientas de IA en su proceso de desarrollo, mientras que el 26% planea hacerlo pronto. Sin embargo, estas herramientas tienen defectos evidentes.
Un análisis de más de 150 millones de líneas de código comprometidas en repositorios de proyectos durante los últimos años por GitClear encontró que las herramientas de desarrollo de IA generativa están resultando en más errores de código en las bases de código. Además, investigadores de seguridad han advertido que estas herramientas pueden amplificar los errores y problemas de seguridad existentes en los proyectos de software; según un estudio de Purdue, más de la mitad de las respuestas que da ChatGPT de OpenAI a preguntas de programación son incorrectas.
A pesar de estos problemas, compañías como Mistral y otras seguirán intentando monetizar (y ganar cuota de mercado con) sus modelos. Esta mañana, Mistral lanzó una versión alojada de Codestral en su plataforma de IA conversacional Le Chat, así como su API paga. Mistral también ha trabajado para integrar Codestral en marcos de aplicaciones y entornos de desarrollo como LlamaIndex, LangChain, Continue.dev y Tabnine.
En Awtana, siempre estamos emocionados por las innovaciones tecnológicas y sus potenciales impactos en nuestras vidas y trabajos. El lanzamiento de Codestral por parte de Mistral representa un avance significativo en el campo de la IA generativa aplicada al desarrollo de software. Aunque el modelo tiene sus limitaciones y desafíos, su capacidad para asistir en la codificación y la gestión de bases de código es impresionante. Sin embargo, también es crucial abordar y considerar las implicaciones éticas y prácticas de su uso. Continuaremos observando de cerca estos desarrollos y compartiendo con ustedes las últimas noticias y análisis.