Con la IA te convertirás en todo un jedi de la creación audiovisual

1 julio, 2024

by nair Sin categoría

¿Tienes una idea brillante surge en tu mente para un corto audiovisual, pero no sabes por dónde empezar? El camino desde la idea inicial hasta el producto final parece un desafío monumental para cualquier amateur en el mundo del audiovisual, aunque llevar a cabo tu idea hoy es más fácil que nunca. Aquí es donde la inteligencia artificial (IA) entra en escena, un aliado inesperado que te ayudará a llevar a cabo tu idea y convertirlo en un producto digno de ganar un Fugaz.

Mantén cerca a tus amigos, pero más cerca aún a tus ideas

Todo empieza con una chispa de inspiración, una imagen, una frase, una sensación que quieres capturar. Pero, ¿Cómo convertir esa idea en una historia coherente? Aquí es donde puedes explorar herramientas de IA para poder moldear tu historia. Por ejemplo, puedes usar un asistente de IA para generar ideas y que te ayude a desarrollar la sinopsis. Seguro que estás preguntándote ¿puede una máquina realmente entender la esencia de lo que quiero transmitir? La respuesta es sí. La IA no solo puede comprender tus instrucciones, sino que también te sugerirá cambios como giros narrativos interesantes que enriquecerán aún más la historia.

¿Tienes una historia pero no acabas de cogerle el gusto a escribir guiones? No te preocupes, todos tenemos días malos. Pero no la IA, que te ofrecerá diálogos fluidos y estructuras narrativas coherentes. Cuando te encuentres en un bloqueo creativo, la IA te lanzará un salvavidas, ofreciendo soluciones y nuevas perspectivas.

Te dejamos algunas ideas de softwares de IA que puedes utilizar para llevar a cabo este paso:

ChatGPT: Para generar ideas, sinopsis y guiones preliminares basados en tus instrucciones.
Scrivener: Un software de escritura que ayuda a organizar ideas y guiones de manera estructurada.
Celtx: Ofrece herramientas para la escritura de guiones y la preproducción, incluyendo la generación de ideas y la organización del guion.

Hazlo o no lo hagas, pero no lo intentes

Generar un storyboard es un proceso largo y en el que la creatividad de uno se puede ver comprometida. Sin embargo, hay varias herramientas que se basan en IA para convertir las palabras en imágenes que puedas usar para montar tu story. Lo único que necesitarás será una buena capacidad para describir las imágenes que necesitas voilà! Se transformarán en un storyboard digno de Hollywood, y habiendo empleado la mitad de tiempo. Algunos softwares que te pueden ayudar son:

Storyboard That: Permite crear storyboards visuales a partir de descripciones de texto.
Plotagon: Una herramienta para crear animaciones sencillas y storyboards de manera intuitiva.

Ya tenemos el proyecto y el siguiente paso es la fase de rodaje. Incluso aquí, la IA será tu mejor asistente. Desde el uso de drones equipados con IA para tomar imágenes aéreas y completamente estabilizadas hasta las funciones que incluyen las cámaras para mejorar las imágenes que tomes, la IA te ayudará a ser tu propio camarógrafo, director de fotografía y director. Así, te asegurarás de que la calidad de tus grabaciones no pase desapercibida.

Dar cera, pulir cera

Editar, ese gran enemigo (para algunos). No te estreses, que la IA también puede ayudarte. Los softwares de edición potenciados por IA pueden, por ejemplo, identificar los momentos impactantes de cada toma, sugerir cortes y transiciones, y hasta hacer ediciones automáticas que siguen el ritmo de la música que quieres utilizar. No hace falta que inviertas mucho o que busques más allá de lo que utilizas siempre, porque softwares como Adobe Premiere o Final Cut ya han añadido funciones que trabajan con IA.

¿Qué sería de nosotros sin los efectos especiales? Para ello también existen programas que pueden aplicar algún estilo en concreto a las secuencias, hacer modificaciones de, por ejemplo, las localizaciones o cualquier tipo de locura que se te pueda ocurrir en el momento. Cada detalle añadido por la IA hizo que tu corto tenga una imagen muy cuidada y profesional. Algunas sugerencias que te hacemos son:

After Effects: Utiliza IA para aplicar efectos visuales impresionantes y estilos artísticos a las secuencias de video.
DeepArt: Aplicación de IA que permite aplicar estilos artísticos a imágenes y videos.

¡Hasta el infinito y más allá!

Todo el que se quiere dedicar al mundo audiovisual sabe que hacer una película no es nada sin público, y que hay que empezar a moverla en el mercado, es decir, empezar el proceso de distribución. La IA te ayudará a hacer análisis de mercado y a saber a qué tipo de público es interesante que te acerques y que entables relación, así como la promoción y ,las campañas que tendrás que llevar a cabo en redes sociales. Llevar a cabo este proceso de análisis te ayudará a obtener la mayor visibilidad posible. Plataformas como YouTube ya están utilizando IA para mejorar las miniaturas y títulos, atrayendo más ojos hacia los proyectos.

La escucha activa también va a formar parte del proceso. Ver cómo el público reacciona, qué es lo que más gusta o qué contenido puede ser controversial te ayudará a crear la mejor campaña para tu proyecto, poniendo énfasis en aquellas partes que resulten más interesantes. Al final, hoy en día todos estamos conectados en las redes y ver la respuesta de parte de los usuarios te ayudará a crear una visión clara de cómo promocionar. Para ello puedes usar herramientas como Hootsuit Insights o Brandwatch, que te ayudarán a analizar y medir el sentimiento de tu público en aquellas plataformas donde decidas moverlo.

Siempre nos quedará la IA

Es innegable que el futuro es la Inteligencia Artificial. Los procesos en los que se involucran algoritmos que utilizan esta tecnología se ven enriquecidos y muchas veces te pueden ayudar a dar ese paso cuando te sientes inseguro. No solo se trata de simplificar procesos o ahorrar dinero en ellos, sino que se trata de tomar el control de tu propia obra audiovisual sin perder el objetivo y obteniendo el mejor resultado en el proceso. No te dejes intimidar por el mundo audiovisual, que a menudo parece inaccesible. Visita estas herramientas, utilízalas y equivócate. Recuerda que, tal y como dijo Morfeo, “no existen preguntas sin respuesta, sino preguntas mal formuladas”, así que atrévete a preguntarle a la IA todo aquello que necesites.

¡Ey! ¿Tú ya “gepeteas”?

27 mayo, 2024

by nair Comunidad Noticias Sin categoría

En el mundo empresarial, la innovación y la eficiencia son clave para ser competitivo y mantenerse al nivel. La inteligencia artificial está revolucionando la manera en que realizamos nuestras tareas diarias. Tan importante se ha convertido en el día a día de todo el mundo, ya seas un estudiante o un community manager, que la RAE ya ha aceptado un término para nosotros: «gepetear».

¿Qué significa «gepetear»?

«Gepetear» es una palabra que viene del uso, cada vez más generalizado, de GPT (Generative Pre-trained Transformer), una tecnología avanzada de inteligencia artificial desarrollada por OpenAI. Esta palabra surge de la necesidad de describir de una manera más natural el acto de utilizar modelos GPT para diversas aplicaciones. En esencia, «gepetear» resume la idea de utilizar GPT para generar textos de manera automática, ayudando en la creación de contenido, automatizando procesos y proporcionando soporte en múltiples tareas.

¿De dónde ha surgido?

El término «gepetear» es un término acuñado por la Fundación del Español Urgente que combina el acrónimo GPT con el sufijo «-ar», común en el español para formar verbos que indican una acción continua o repetitiva. Su uso ha comenzado a expandirse a medida que más personas y empresas adoptan esta tecnología para optimizar su trabajo diario. ¿Te animas a ser uno de ellos?

¿Cómo puede beneficiar «gepetear» a tu negocio?

Automatización de Contenidos: desde la creación de artículos de blog hasta la redacción de correos electrónicos y reportes, «gepetear» permite generar contenido de alta calidad en cuestión de minutos, ahorrando tiempo y recursos.
Asistencia al Cliente: implementar chatbots impulsados por GPT puede mejorar significativamente la experiencia del cliente, proporcionando respuestas rápidas y precisas a sus consultas, las 24 horas del día.
Investigación y Análisis: «gepetear» con GPT ayuda a recopilar y analizar grandes volúmenes de datos, facilitando la toma de decisiones informadas y estratégicas.
Innovación Creativa: utilizar GPT para brainstorming y generación de ideas puede abrir nuevas oportunidades creativas y estratégicas, impulsando la innovación dentro de tu empresa.

¿Gepeteas con nosotros?

Contáctanos a través de nuestro para descubrir cómo puedes empezar a gepetear en tu empresa y llevar tu productividad al siguiente nivel. ¡Hablemos y exploremos juntos las posibilidades!

DALL·E 2023-12-02 12.01.50 - A striking image illustrating the dichotomy between artificial intelligence and art, set against a white background. On one side, a detailed, mechanic

La Inteligencia Artificial en el Arte: Una Perspectiva Multidimensional

2 diciembre, 2023

by Info Saturdays Noticias

En un momento en el que la intersección entre la tecnología y el arte está redefiniendo ambas esferas, la inteligencia artificial (IA) emerge como un tema de discusión fascinante y divisivo. Para profundizar en esta temática, hemos reunido las perspectivas de tres figuras prominentes, cada una aportando una visión única desde su campo de experiencia: Fabián Ignacio, conocido como Norero.ve, un artista con una significativa presencia en TikTok y Instagram; Pablo Talavante, un científico de datos e ingeniero de aprendizaje automático especializado en IA; y Sergi Calsina, un ilustrador y profesor de instituto.

Fabián Ignacio: IA Como Herramienta de Ampliación Creativa

Fabian Ignacio, más conocido como Norero.ve en Instagram y TikTok, donde tiene una audiencia de más de 93 mil y 305 mil seguidores respectivamente, aporta su perspectiva como artista en la intersección del arte y la IA. Aunque personalmente no ha experimentado con IA en su proceso creativo, Fabián ve un enorme potencial en esta tecnología como un medio para expandir las posibilidades artísticas y desafiar las convenciones tradicionales. Ve la IA no solo como una herramienta para la creación, sino también como una fuente de inspiración y colaboración, ofreciendo nuevas perspectivas y enfoques en el proceso artístico. Resalta la importancia de la intervención humana en la utilización de la IA, enfatizando que el verdadero valor artístico surge cuando los artistas dirigen y moldean el output de la IA, integrándolo en su visión y obra.

@norero.ve
este ha sido el más difícil de hacer ✨?Norero.ve #art #noreroart #AprendeConTikTok #tips #arte #viral #fyp #chile #color
♬ sonido original – Norero ?

Pablo Talavante: La IA Como una Nueva Herramienta Artística

Pablo Talavante: La IA como una Revolución en el Arte Contemporáneo

Pablo Talavante, un experto en inteligencia artificial y aprendizaje automático, ofrece una perspectiva innovadora sobre la integración de la IA en el arte, comparable a revoluciones pasadas como la fotografía, resaltando su potencial para desbloquear nuevas formas de expresión creativa. Al abordar temas clave como «Inteligencia Artificial en el Arte» y «Derechos de Autor en la Era Digital», Talavante plantea preocupaciones sobre la transparencia y la legislación en el entrenamiento de modelos de IA, un tópico relevante para la audiencia interesada en «Innovación en Arte Digital». Subraya la importancia de la intencionalidad en la creación artística, independientemente de las herramientas utilizadas, lo que resuena con los temas de «Creatividad y Tecnología». Su enfoque en la democratización del arte a través de la IA y la necesidad de equilibrar innovación con respeto a los derechos de autor refleja una comprensión profunda de las complejidades del arte en la era digital, ofreciendo una visión crítica y reflexiva que enriquece el debate sobre cómo la IA está reconfigurando el panorama artístico contemporáneo.

Aquí puedes leer más sobre lo que opina Talavante sobre arte y inteligencia artificial.

Sergi Calsina: Enfoque Humano en el Arte

Sergi Calsina, cuyas obras pueden encontrarse en @calsinaart, destaca la expresividad y el sentimiento como elementos clave del arte, características que considera intrínsecamente humanas. Según Calsina, aunque la IA puede replicar estilos con precisión, carece de la capacidad para capturar genuinamente la emoción humana. Expresa su preocupación por cómo la IA podría afectar los derechos de autor y la valoración del trabajo artístico tradicional. Insiste en que cualquier uso legítimo de la IA en el arte debe involucrar un acuerdo claro sobre los derechos de imagen y reconocer el papel esencial del artista humano en el proceso creativo.

Ver esta publicación en Instagram

Una publicación compartida por Calsina (@calsinaart)

Conclusiones

La integración de la inteligencia artificial en el arte marca no solo la adopción de nuevas herramientas y técnicas, sino también una transformación profunda en nuestra comprensión y apreciación de la creatividad y la expresión artística. Las visiones de Fabián Ignacio (Norero.ve), Pablo Talavante y Sergi Calsina ofrecen un abanico de opiniones que reflejan la diversidad y la complejidad de este cambio paradigmático.

Fabian Ignacio, con su enfoque como artista digital, ve la IA como una oportunidad para expandir los límites del arte, enfatizando la importancia de que los artistas humanos mantengan el control creativo. Pablo Talavante, desde su experiencia en ciencia de datos y aprendizaje automático, considera la IA como una extensión natural de las herramientas artísticas, subrayando la necesidad de intencionalidad en su uso para elevarla más allá de la simple generación de imágenes y situarla en el ámbito del verdadero arte. Por otro lado, Sergi Calsina resalta la importancia de la emoción y expresividad humanas en el arte, aspectos que, en su opinión, la IA aún no puede replicar, y manifiesta su preocupación por los derechos de autor y la valoración del arte tradicional en la era de la IA.

Estas diversas perspectivas ponen de relieve una verdad innegable: la IA está redefiniendo el mundo del arte de maneras sorprendentes e inesperadas. Con el avance de esta tecnología, emergen interrogantes sobre la autoría, la originalidad y el valor del arte. La pregunta que surge es si la IA puede convertirse en una colaboradora plena en el proceso creativo, o si siempre será percibida como una herramienta auxiliar en manos de artistas humanos. La tarea de equilibrar la innovación tecnológica con el respeto a los derechos de autor y la autenticidad de la expresión artística se presenta como un desafío crucial.

En definitiva, la convergencia entre la IA y el arte nos impulsa a replantear nuestras definiciones de creatividad y expresión. Nos encontramos ante un territorio inexplorado, repleto de posibilidades y desafíos, que exige un diálogo constante entre artistas, tecnólogos, legisladores y el público. Lo que es evidente es que la IA ha llegado para revolucionar el arte, y su impacto continuará evolucionando y cautivándonos en los años venideros.

La imagen presenta una fascinante representación de la dicotomía entre la inteligencia artificial (IA) y el arte. A un lado, una entidad AI detallada y mecánica, compuesta por intrincados circuitos e iluminada con luces azules brillantes, simboliza la precisión y lógica de la tecnología. En contraste, al otro lado, se encuentra una figura humana envuelta en una prenda colorida y fluida, sosteniendo un pincel y una paleta, que representa la libertad y la emoción del arte. Las dos figuras se enfrentan, simbolizando el encuentro de estos dos mundos contrastantes. La composición, situada sobre un fondo blanco limpio, es simple pero impactante, enfatizando el contraste entre estos dos aspectos fundamentales de la creatividad y la innovación. — Dicotomía entre la inteligencia artificial (IA) y el arte.

Información acerca de Saturdays.ai

La misión de Saturdays.ai es hacer la inteligencia artificial más accesible #ai4all mediante cursos y programas intensivos donde se realizan proyectos para el bien #ai4good.

Hazte miembro premium de Saturdays y podrás aprovechar todos los beneficios de una comunidad líder en Inteligencia Artificial: https://saturdays.ai/become-a-member

Si quieres aprender más inteligencia artificial únete a nuestra comunidad en community.saturdays.ai o visítanos en nuestra web www.saturdays.ai ¡te esperamos!

oficina de un medio de comunicación que usa las últimas herramientas en inteligencia artificial

La Inteligencia artificial: clave para un periodismo preciso y eficiente

3 noviembre, 2023

by Info Saturdays Noticias Sin categoría

La Inteligencia Artificial (IA) está revolucionando el periodismo, ofreciendo herramientas avanzadas que optimizan la redacción y edición de contenido. Esta tecnología no sólo acelera el proceso editorial, sino que también eleva la precisión y fiabilidad del periodismo. Con la verificación de hechos en tiempo real y la mejora de la calidad de escritura, la IA se convierte en un aliado clave en la lucha contra la desinformación y las noticias falsas. Su integración en las salas de redacción modernas garantiza una entrega de noticias más rápida y una información de calidad que los lectores pueden confiar.

Periodista usando herramientas de inteligencia artificial que le ayudan a hacer más fácil su trabajo

Herramientas de inteligencia artificial que debes utilizar como periodista

La Inteligencia Artificial está ayudando a los periodistas a trabajar más rápido y con mayor precisión. Estas herramientas de IA son muy útiles, ya que ofrecen consejos para escribir mejor, corrigen la gramática y verifican los hechos al momento.

El objetivo principal de escribir noticias es compartir información de forma clara y correcta. La Inteligencia Artificial ayuda a los periodistas dándoles consejos instantáneos para escribir mejor y más claro. Herramientas como Grammarly o Hemingway Editor ofrecen ayuda en el momento para que la escritura sea más directa y comprensible.

La Inteligencia Artificial también es muy buena corrigiendo la gramática. A veces, los periodistas no ven pequeños errores por la prisa o por tener que actualizar constantemente sus artículos. Pero las herramientas de IA como Language Tool pueden encontrar y arreglar estos errores rápido, para que los textos sean de alta calidad antes de que se publiquen.

Verificar que lo que se dice es muy importante para que las noticias sean confiables. Programas de IA como Newtral o Snopes ayudan a los periodistas a comprobar los datos rápidamente antes de difundir una noticia. Esto no solo hace que la información sea más precisa, sino que también ayuda a luchar contra las noticias falsas, que son un problema grande hoy en día.

Conclusión

La Inteligencia Artificial no busca reemplazar a los periodistas, sino fortalecer su labor, permitiendo que se enfoquen en lo que mejor hacen: investigar, analizar y contar historias que importan. En un mundo inundado de información, la IA se presenta como una herramienta poderosa para asegurar la calidad, precisión y rapidez en el periodismo contemporáneo.

Información acerca de Saturdays.ai

La misión de Saturdays.ai es hacer la inteligencia artificial más accesible #ai4all mediante cursos y programas intensivos donde se realizan proyectos para el bien #ai4good. También realizamos proyectos y consultoría para organizaciones que quieren sacar el máximo partido de la IA.

Si como nosotros te gusta la tecnología, hazte miembro premium de Saturdays y podrás aprovechar todos los beneficios de una comunidad líder en Inteligencia Artificial: https://saturdays.ai/become-a-member

En nuestra web tienes cursos online gratuitos y contenido para ayudarte, así como una comunidad de personas apasionadas como tú, ¡te esperamos!

IA: Más allá de los chatbots

13 junio, 2023

by Info Saturdays Noticias

Descubre cómo la IA está transformando nuestro mundo, desde la detección temprana de enfermedades hasta la lucha contra el cambio climático, yendo más allá de los chatbots y los algoritmos que comúnmente conocemos.

IA en la Medicina: Un caso digno de milagro.

1 junio, 2023

by Info Saturdays 2022 Noticias

Cómo la inteligencia artificial está revolucionando la ingeniería biomédica con una interfaz cerebro-médula espinal entrenada con IA, permitiendo a Gert-Jan Oskam recuperar la movilidad después de 12 años de paraplejia.

Transformación de Imágenes de Angiotomografía por medio del uso de Inteligencia Artificial.

9 marzo, 2022

by Info Saturdays 2021 Latam

Latam online. Segunda Edición. 2021

Angiotomografías con contraste ¿Cuál es el problema?

El reto

Los medios de contraste vía endovenosa que se usan en las angiotomografias contrastadas pueden tener incidencia en la salud nefrológica de los pacientes, sobre todo en aquellos que tienen antecedentes de hipertensión arterial, hipercolesterolemia, antecedentes genéticos, en edad adulta mayor (60 años en adelante) y un riesgo cardiovascular aumentado (1), es decir, son más propensos a:

tener accidentes cerebrovasculares,
infarto agudo de miocardio,
enfermedad arterial periférica y,
enfermedades de la aorta en general

Existe la posibilidad de realizar angiotomografias simples que no requieren el uso de medios de contraste y que tienen un costo menor (alrededor de $200,00 de diferencia), pero estas no permiten una visualización completa de las estructuras aórticas con claridad (2), por lo que no son útiles en muchos casos, como en el de Jesús.

Por qué escogimos Angiotomografías?

La oportunidad ¿Cómo proponemos solucionarlo?

ANGIOP.AI (Sistema de Transformación de Imágenes de Angiotomografía) genera avances significativos en el análisis de imágenes médicas mediante modelos de análisis de inteligencia artificial para angiotomografias, brindando una alternativa que signifique un menor impacto para la salud de los pacientes que, por su diagnóstico y estado general, requieren realizarse este tipo de análisis de manera recurrente.

Figura 1. Estructura del modelo GAN aplicado a la transformación de imágenes de Angiotomografía

ANGIOP.AI basa su funcionamiento en el entrenamiento, validación y evaluación de un modelo CycleGAN para procesar imágenes de angiotomografias sin contraste y transformarlas en imágenes similares a las que se obtendrían usando métodos de contraste; se entrena un CycleGan para leer una imagen de un dataset X (imágenes sin contraste) y transformarlo para que parezca como si perteneciera a un dataset Y (imágenes con contraste).

¿Cuáles son los beneficios?

ANGIOP.AI está alineada al cumplimiento de los objetivos de desarrollo sostenible de las Naciones Unidas al 2030.

Lo explicamos paso a paso: metodología, modelo usado y datasets

Los datasets utilizados corresponden a los provistos por el Dr. Gonzalo Pullas, director de la carrera de Medicina en la Universidad de las Fuerzas Armadas; quien facilitó las imágenes de angiotomografias con contraste y angiotomografias simples (sin contraste) de 10 pacientes anónimos.

El total de imágenes facilitadas fueron de 5.144, de tamaño 512 x 512, en escala de grises, a las que se les aplicó una exploración de los datos — análisis estadístico para descartar imágenes a color y en 3D, sin datos atípicos y con Diferencias en distribución de pixeles (zonas / cortes). Es importante mencionar que las angiotomografías fueron tomadas en la misma zona anatómica, pero en diferentes oportunidades, es decir, las imágenes no corresponden a una paridad 1:1.

El modelo utilizado es CycleGan con pre-procesamiento de imágenes de escala -1 a 1 para la entrada del modelo. Los discriminadores son redes convolucionales con 5 capas que receptan imágenes de 256×256. Las 4 capas son de definición de patrones y una capa de clasificación. El generador utiliza tres capas convolucionales y seis bloques residuales. Para el cálculo de las funciones de costos, tanto para las imágenes reales como falsas, se está utilizando el proceso del error cuadrático medio (mean squared error).

El modelo utiliza los siguientes parámetros:

20000 épocas
Tasa de aprendizaje del 0,0001

Para el entrenamiento se aplicaron los siguientes pasos:

Seleccionar una cantidad de imágenes reales
El generador toma las imágenes reales y les agrega ruido para crear una cantidad de imágenes falsas
Entrenar al discriminador, haciendo que clasifique las imágenes como falsas o verdaderas un cierto número de veces o épocas
Generar otra cantidad de imágenes falsas para entrenar el generador
Se entrena al modelo
Para finalizar el modelo, se debe revisar la veracidad de la ejecución, revisando el gráfico de pérdidas a través del tiempo y revisando las muestras generadas por el modelo.

Veamos los resultados:

Lecciones aprendidas

Enseñar al modelo a validar las imágenes de entrada si corresponde a la zona angio toráxica.
Aumentar el Dataset para futuros entrenamientos.
Se requiere una validación de las imágenes generadas con un panel de expertos médicos.

Lo que se viene: Futuro de ANGIOP.AI

Usar la data generada para medir el impacto del uso del sistema en reducción de incidencia de enfermedades renales.
Desarrollar una aplicación Web.

Referencias

(1) Cueva Torres, Dr., F. (2021). Epidemiología y Manejo de las Enfermedades de la Aorta — SIAC. Sociedad Interamericana de Cardiología.

(2) RadiologyInfo para pacientes (2020). Materiales de Contraste.

(3) World Heart Federation (2016) World Congress of cardiology & Cardiovascular Health

(4) Ferreira, J (2017) Actualidad en nefropatía por medio de contraste. Universidad Pontificia Bolivariana, Medellín — Colombia. ELSEVIER Volumen 14 Número 2

Integrantes

Diego Chiza, Ana Gayosso, Gabriela Jiménez, Paola Peralta, Patricia Román José Daniel Sacoto, María Teresa Vergara, Hilario Villamar, David Medrano.

Presentación del proyecto: DemoDay

Repositorio

El código fuente de este proyecto se puede encontrar en: github

¡Más inteligencia artificial!

La misión de Saturdays.ai es hacer la inteligencia artificial más accesible (#ai4all) mediante cursos y programas intensivos donde se realizan proyectos para el bien (#ai4good).

Si quieres aprender más inteligencia artificial únete a nuestra comunidad en community.saturdays.ai o visítanos en nuestra web www.saturdays.ai ¡te esperamos!

Inteligencia artificial para la detección de Aglomeración de Basura

9 marzo, 2022

by Info Saturdays 2021 Latam

**Figura 1.- Acumulación de basura en las calles.**

Latam online. Segunda Edición. 2021

En la actualidad, los desechos municipales a nivel mundial podrían aumentar un 70% en los próximos 30 años, provocando así montones de basura acumulados alrededor del mundo (Banco Mundial, 2019). Es por esto que, si no se toman medidas urgentes, se espera un futuro donde el convivir con basura sea algo normal para la sociedad.

Debido a las consecuencias de las acumulaciones de basura no controladas ni planificadas se deben tomar diferentes estrategias que amortigüen sus ocurrencias en distintos puntos del mundo.

Descripción del problema

El problema de la acumulación de basura no solo radica en el mal olor que se percibe, sino la imagen de insalubridad, desorden y hasta de inseguridad que la basura se desparrama en las calles genera. En las calles se puede encontrar desde cartones y pañales, hasta cáscaras de frutas, plástico y sábanas viejas. Todo esto al pie del canal de aguas lluvias, en cuyas bases también es común ver flotando todo tipo de desechos.

Según el Ministerio del Ambiente, en el Ecuador la más crítica es la Costa, en donde apenas el 10% de los municipios dispone de un relleno sanitario, manual o mecanizado; en la región Sierra son 25%, y en el Oriente, el 24%. Por lo que las cifras de basura dentro del país aumentan diariamente tal y como se visualiza en la Figura 2.

**Figura 2.- Cifras de la basura en el Ecuador.**

En la figura 2.1, se visualizan algunas de las consecuencias de la acumulación de basura como lo son: daños en la infraestructura pública, aumento de enfermedades y plagas, inundaciones en las calles, obstrucción en los alcantarillados y entre otros.

**Figura 2.1.- Consecuencias de la acumulación de basura.**

En la ciudad de Guayaquil, las penas por desechar desechos sólidos no peligrosos al margen de la frecuencia y horarios establecidos y acumular la basura en parterres y aceras; van desde los $80 a $500 .

¿Cómo nace nuestro proyecto?

Ciudad Limpia se basó en la siguiente pregunta : ¿Cómo identificar de manera oportuna la acumulación de la basura no controlada en la ciudad de Guayaquil para minimizar el impacto en la sociedad? Por tal motivo creamos una aplicación que nos permite contribuir en la recolección de basura. Haciendo participe a la ciudadanía en mejorar la limpieza de la ciudad y que alguna empresa se interese en nuestra herramienta tecnológica basada en Inteligencia artificial.

Integrantes del proyecto

**Figura 3.- Equipo morado — SaturdayAI –ÉPICO 2021**

Experiencia del equipo

Manuel Ahumada “Fue una experiencia de aprendizaje práctico: enfocado en el hacer para adquirir los temas y conceptos presentados. Eso refuerza el conocimiento.”.

Patricia Andrade “Mi experiencia fue muy enriquecedora debido a todo el nuevo conocimiento que aprendí. Además, me gustó mucho el compartir ideas con compañeros de distintos campos para solucionar un problema práctico”.

César Villarroel “Fue una experiencia de aprendizaje práctico: enfocado en el hacer para lograr adquirir los temas y conceptos presentados. Eso refuerza el conocimiento.”.

Ingrid León “La experiencia que se obtiene en esta modalidad es buena, El poder compartir conocimientos, desafíos y riesgos hacen que seamos más profesiones. Me quedo con una frase “«Son dos las opciones básicas: aceptar las condiciones como existen o aceptar la responsabilidad de modificarlas»”, entonces podemos mejorar siempre”.

Objetivo general

En la siguiente figura 4, se puede visualizar la idea principal del proyecto.

Desarrollar una aplicación basada en Inteligencia Artificial que permita identificar aglomeraciones de basura en la vía pública de zonas urbanas.

**Figura 4.- Propuesta de valor del proyecto.**

Planteamiento de la solución

Se proyecta que mediante la colaboración de los ciudadanos se cree una concientización donde formen parte de la limpieza y cuidado de la ciudad. ¿Cómo lo van a hacer? Fácil, a través de la app “Ciudad Limpia” , en donde pueden tomar una foto para identificar y reportar la acumulación de basura de un sector determinado. Además, la aplicación registra la fecha, hora y ubicación del problema. Dicha aplicación estará basada en Inteligencia Artificial que permitirá identificar aglomeraciones de basura en la vía pública de zonas urbanas y fomentar un plan de acción inmediata para las autoridades sanitarias.

**Figura 5.- Diagrama General de la solución.**

Conjunto de datos

El conjunto de datos que se formó fue basado en descarga de imágenes de manera individual desde el Internet, videos transformados en fotogramas. Además, se sacó la plataforma de Kaggle y Google Street view donde se pudo obtener una gran cantidad de dataset de imágenes de aglomeración de basura.

Selección del modelo

Para la selección de los modelos se obtuvo las siguientes consideraciones:

Fácil implementación.
Rendimiento del modelo.
Limitación de cálculo.

Estas consideraciones son debido a los recursos que se tienen para realizar el objetivo general. Los modelos a desarrollarse son:

CCN Personalizado.
VGG-16.
inicioV3.

Técnicas implementadas

La principal técnica utilizada para compensar el conjunto de datos de tamaño limitado por la limitación de búsqueda de imágenes en Google fue la “aumentación de datos” realizada por la librería de keras “ImageDataGenerator”.

Data augmentation

El aumento de datos es la generación artificial de datos por medio de perturbaciones en los datos originales. Esto nos permite aumentar tanto en tamaño como en diversidad nuestro conjunto de datos de entrenamiento. En el computer vision, esta técnica se convirtió en un estándar de regularización, y también para mejorar el rendimiento y combatir el overfitting en CNNs.

**Figura 7.- Ejemplo de aumento de datos.**

En los tres modelos seleccionados se consideraron la técnica de aumento de datos con el objetivo de normalizar o re-escalar los píxeles en un rango de 0 a 1. Además de modificar las imágenes del conjunto tren con el objetivo de que existe una distinción en cada una de las imágenes seleccionadas tanto de ancho, largo, amplitud, rotación y escalamiento. A continuación, se observa el código donde se transforman las imágenes de entrenamiento con los parámetros seleccionados:

**Figura 8.- Código del entrenamiento de imágenes.**

CNN personalizado

En el modelo CNN personalizado se aplicaron técnicas de regulación, callbacks y por último keras tuner.

Keras Tuner

Keras Tuner es una librería muy sencilla de utilizar que simplifica en gran medida complejidad el proceso de aplicar de optimización de hiper-parámetros sobre redes de neuronas profundas construidas mediante Keras, ofreciéndonos un amplio grado de versatilidad para optimizar tanto la estructura de nuestra red como la configuración de los parámetros de algunos de los algoritmos implicados en el proceso de entrenamiento.

**Figura 9.- se puede constatar el valor del ensayo y exactitud**

Keras Tuner mientras va analizando cada trial, verifica el mejor valor de val accuracy infiriendo que es la mejor configuración de la arquitectura y la procede a guardar la mejor configuración de la arquitectura del modelo (número de capas) con el cual tiende a lograr la mejor métrico.

Arquitectura del modelo cnn personalizado cuenta con regularizadores, convolución, keras tuner

InceptionV3

**Figura 11.- muestra el pre-entrenamiento**

Se define el modelo pre-entrenado inceptionv3, valida el tamaño de las imágenes de input con que se entrena:

**Figura 12.- uso de la arquitectura mixed7**

Se congela la arquitectura en la capa “mixed7” para después alterarla añadiendo capas basadas en la predicción de nuestro modelo que es una clasificación binaria por el cual la última capa tiene activación sigmoidal la cual nos ofrece como resultado la probabilidad de que si un caso es positivo o negativo

VGG-16

Se define el modelo pre-entrenado vgg16 y valida el size de las imágenes de input con que se entrena

**Figura 14.- aumento de capas (clasificación binaria)**

Se procede a aumentar las capas basadas en la predicción de nuestro modelo que es una clasificación binaria por lo cual la última capa tiene activación sigmoidal la cual nos ofrece como resultado la probabilidad de que si un caso es positivo o negativo

Análisis de resultados

CNN personalizado

En la evaluación del modelo se entrenó con 20 épocas. Sé puede verificar que no logra converger en su totalidad. Logra una accuracy de la evaluación del conjunto test del 78 %

InceptionV3

**Figura 16.- grafica del modelo pre-entrenado con 50 épocas**

En la evaluación del modelo el cual se entrenó con 50 épocas se puede analizar que logra converger en totalidad a partir de la época 28 en adelante, con una precisión de la evaluación del conjunto test del 85 %

VGG-16

**Figura 17.- gráfica del modelo pre-entrenado con 10 épocas**

En la evaluación del modelo el cual se entrenó con 10 épocas se puede analizar que logra converger, con una precisión de la evaluación del conjunto test del 84 %

A continuación, mostramos las predicciones de los modelos:

InceptionV3

Predicción de la carpeta test

Se obtiene las probabilidades de predicción del conjunto test

Primera prueba sin basura

Prueba del modelo prediciendo una imagen sin basura dando como resultado una probabilidad menor a un umbral de 0.5 se la identifica como una no aglomeración.

Segunda prueba con basura

Prueba del modelo prediciendo una imagen con basura generando una probabilidad mayor a un umbral de 0.5 se la identifica como una aglomeración.

Tercera prueba con imagen y muchos colores

Prueba del modelo prediciendo una imagen falsa positiva intentando romper la predicción en consecuencia se obtiene una probabilidad menor a un umbral de 0.5 se la identifica como una no aglomeración

VGG-16

Predicción de la carpeta de test

Se obtienen las probabilidades de predicción del conjunto test

Primera prueba sin basura

Prueba del modelo prediciendo una imagen sin basura dando como resultado una probabilidad menor a un umbral de 0.5 se la identifica como una no aglomeración

Segunda prueba con basura

Prueba del modelo prediciendo una imagen con basura mostrando una probabilidad mayor a un umbral de 0.5 se la identifica como una aglomeración

Tercera prueba con imagen de diferentes colores

Métricas del modelo elegido: InceptionV3

Matriz de confusión

En la matriz de confusión podemos deducir que está prediciendo aceptablemente, pero puede mejorar la predicción de los falsos negativos esto se puede solucionar aumentando imágenes de positivos para que el entrenamiento del modelo mejore los positivos

Métricas

Las métricas obtenidas son aceptables con un f1 score del 85 % de predicción para casos negativos y un 84 % para casos positivos, esto confirmaría la teoría de aumentar los datos en positivos

Aplicación móvil (“Ciudad Limpia”)

Por qué elegimos App Inventor?

En la actualidad, existen muchas maneras de desarrollar aplicaciones en dispositivos móviles que cumplen con una función en específico y son compatibles con distintos sistemas operativos.

Es por esto, que se seleccionó como herramienta de programación y desarrollo de nuestra App “Ciudad Limpia” al entorno de App Inventor . Mediante esta plataforma se puede programar en JavaScript de manera fácil y sencilla debido a que utiliza una programación en bloques que permite un mayor entendimiento y uso por parte del usuario.

Arquitectura

Con respecto a la arquitectura de nuestra aplicación “Ciudad Limpia”, se tiene los siguientes pasos a seguir, tal como se observa en la siguiente ilustración ():

Conexión de App Inventor con Google Colab

La conexión de la aplicación “Ciudad Limpia” con el modelo creado a través de Google Colab se realiza a través de la creación de un servidor local expuesto al Internet para el acceso de la aplicación móvil utilizando ngrok. Realizando una petición POST desde APP Inventor, se realiza el envío de la imagen codificada en bit64 al servidor el cual ejecuta el modelo y devuelve el resultado obtenido clasificado como aglomeración o no aglomeración de basura.

Funcionalidad de la aplicación «Ciudad Limpia»

Con respecto al entorno y manejo de la App “Ciudad Limpia” se consideran tres botones dentro de la interfaz con distintas funciones al momento de procesar una fotografía:

· Usuario “toma foto”: En este caso, el usuario utiliza la cámara de su dispositivo para capturar la imagen de la aglomeración de basura en su sector.

· Usuario selecciona “foto de galería”: En este caso, el usuario selecciona una foto que tenga registrado sobre la aglomeración de basura en su sector que encuentre dentro de su galería de imágenes de su celular.

· Usuario “sube foto”: En este caso, el usuario sube la foto de la aglomeración de basura en su sector para que sea registrado y notificado a las autoridades pertinentes y se pueda visualizar dentro de la aplicación el resultado de si existe o no una aglomeración.

Almacenamiento de datos

Una vez realizada la predicción de la aglomeración de la basura dentro de la aplicación se procede a crear una base de datos a través de la aplicación de Google drive en extensión .csv, en donde se consideran los siguientes parámetros:

– Longitud

– Latitud

– Resultado de la predicción del modelo

– ID de la imagen capturada.

A continuación, se puede observar el archivo final generado con todos los datos que ha recolectado:

Funcionamiento de la interfaz

Herramienta BI

De acuerdo a los resultados que genera el modelo y los datos que guarda la aplicación web. Hemos considerado por uso en el mercado, la facilidad de uso, mejor visualización de objetos y desarrollar el tablero en Power BI.

Power BI es una herramienta que se utiliza principalmente para crear cuadros de mando que facilitan la toma de decisiones.

La información se puede actualizar de manera automatizada o manual y permite la compartición de los informes mediante la propia herramienta.

Por todo lo antes mencionado se procedió en la utilización de dicha herramienta.

Extracción de datos

Una vez que la aplicación web guardó los datos, realizamos los siguientes pasos que muestra la siguiente gráfica.

Mediante los campos: latitud, longitud, timestamp, aglomeración (1-Si, 0-No). Creamos un tablero que contenga varios objetos como KPI ‘s, gráficos de barras, gráficos pastel y hasta mapas. Así de manera visual tener una mejor comprensión de los resultados.

**Figura 21.- Mapa de calor de la ciudad de Guayaquil**

Dicha información nos permite poder identificar a través de un mapa en qué puntos de la ciudad tenemos más aglomeraciones de basura, en qué fechas y día se identificó la mayor cantidad de aglomeración y hacer una mejora en cuanto a la recolección de basura.

Recursos

· Basura: los números rojos de Ecuador. (2019, 6 marzo). Plan V. https://www.planv.com.ec/historias/sociedad/basura-numeros-rojos-ecuador

· F., & de Franspg, V. T. L. E. (2020, 20 septiembre). Generación de datos artificiales (Data Augmentation).

o https://franspg.wordpress.com/2020/01/27/generacion-de-datos-artificiales-data-augmentation/#:%7E:text=Data%20augmentation%20es%20la%20generaci%C3%B3n,set%20de%20datos%20de%20entrenamiento

· World Bank Group. (2019, 6 marzo). Convivir con basura: el futuro que no queremos. World Bank. https://www.bancomundial.org/es/news/feature/2019/03/06/convivir-con-basura-el-futuro-que-no-queremos#:%7E:text=Se%20proyecta%20que%20la%20r%C3%A1pida,podr%C3%ADa%20ser%20la%20nueva%20normalidad.

Integrantes

Ingrid León A.
Alessandra Palacios
Manuel Ahumada
César Villarroet
Patricia Andrade
Iván Ortiz
Diana López
Diego Sánchez

Presentacion del proyecto: DemoDay

Repositorio

Toda la explicación en cuanto a implementación, código, entrenamiento del modelo, uso de interfaz y herramienta BI se puede encontrar en el siguiente link:

https://github.com/SaturdaysAI/Projects/tree/master/LATAM_remote/ciudadlimpia

¡Más inteligencia artificial!

La misión de Saturdays.ai es hacer la inteligencia artificial más accesible (#ai4all) mediante cursos y programas intensivos donde se realizan proyectos para el bien (#ai4good).

Si quieres aprender más inteligencia artificial únete a nuestra comunidad en community.saturdays.ai o visítanos en nuestra web www.saturdays.ai ¡te esperamos!

Contenedor de residuos educativo inteligente

9 marzo, 2022

by Info Saturdays 2021 Latam

«Aprendí que nunca somos demasiado pequeños para hacer la diferencia»
Greta Thunberg

Latam online. Segunda Edición. 2021

Es una de las frases celebres de Greta Thunberg, haciendo alusión al poder de los jóvenes de cambiarlo todo, en particular su forma de ver el mundo y las oportunidades de hacer cosas nuevas en pro de su futuro.

Pero… y sí ese futuro se ve gris y contaminado ¿Entonces cómo pueden hacer la diferencia hoy?

Actualmente, muchos jóvenes se preocupan por los problemas ambientales, volviéndose actores proactivos en la búsqueda de soluciones, esta urgencia de cambio nos motivó a crear ConciencIA Ecológica para enseñar a los niños la forma correcta de clasificar sus residuos de una manera divertida, promoviendo las prácticas de las (4R), Reducir, Reutilizar, Reciclar y Recuperar, utilizando tecnología e inteligencia artificial.

Este equipo conformado por siete (07) apasionados de la inteligencia artificial ha unido tres países como: Ecuador, México y Venezuela, participando en la 2da edición de Saturdays.AI LATAM y a través de su método build to learn elaboró un proyecto basado en Deep Learning llamado ConciencIA Ecológica, enfocado en estudiantes de educación básica de la ciudad de Guayaquil — Ecuador.

Si quieres saber más te invito a seguir leyendo.

Integrantes del equipo del proyecto ConciencIA Ecológica

El problema

De acuerdo al Instituto Nacional de Estadísticas y Censo (INEC), en el año 2017 cada ecuatoriano produjo 860 gramos de residuos sólidos en un día, a pesar de que este número se encontró por debajo del kilogramo de basura por día en América Latina y el Caribe, ese año se tuvo un crecimiento de 48% con respecto al año anterior, por lo que no es sorprendente imaginar, que si no se tomaron medidas a tiempo, estos números sean mayores hoy en día.

De la basura recolectada el 96% se entierra en rellenos sanitarios, celdas emergentes o botaderos a cielo abierto y solo el 4% se recicla. Para tener una idea de las razones por la que el reciclaje es bajo, en el 2016 el INEC realizó una encuesta de hogares detectando que el 59% de los hogares no clasificaron residuos.

Cuando se le preguntó las razones por las cuales no clasificaban, el 43% respondió por la falta de contenedores específicos. Sin embargo, el 57% restante se debió a problemas culturales: “no saben clasificar” (18%), “no le interesa” la clasificación de residuos (16%), dicen “no conocer los beneficios” (15%) o el restante (8%) no confía en los sistemas de recolección de basura.

De esta realidad, Guayaquil es la primera ciudad que produce basura generando el 28% del total de desechos diarios del país, y la más elevada a nivel de porcentaje de desinterés: el 29% de los ciudadanos no le interesa clasificar, el 15% no conoce los beneficios y el 6% no sabe clasificar, este desinterés es seguido por Ambato (20%), Machala (14%), Quito (11%), Cuenca (9%).

Por esta razón nuestro proyecto centra sus esfuerzos en esta ciudad y abre su primer capítulo llamado Guayaquil.

Los niños no sólo son el futuro, también son el presente del mundo

Los niños de hoy serán los adultos del mañana, si queremos cambiar la forma como las personas interactúan con nuestro planeta, debemos empezar desde edades tempranas creando hábitos amigables con el ambiente, y estos pueden estimularse en la escuela a través de la educación y la creación de espacios destinados a las buenas prácticas ambientales.

Conscientes de los anterior nace la idea de ConciencIA Ecológica el cual busca enseñar a los niños a clasificar sus residuos de forma divertida.

Este proyecto se enfoca en disminuir el desinterés y el desconocimiento en la clasificación de residuos de estudiantes de educación básica en la ciudad de Guayaquil, a través de contenedores con visión inteligente que oriente a niños desde los 5 años hasta los 14 años, en la correcta clasificación y gestión de residuos, promoviendo las prácticas de Reducir, Reutilizar, Reciclar y Recuperar (4R).

La propuesta une varios conceptos, primero buscando que el niño desde la edad escolar se familiarice con la gestión de residuos, orientándose a través de audio y luces hacia el contenedor correcto, también que gestione correctamente el residuo en su contenedor contribuyendo a la clasificación desde el origen, y creando conciencia en el niño a través de mensajes educativos.

Los contenedores están pensados para poder medir el volumen de residuos y emitir una señal al encontrarse el recipiente lleno, esto permitirá a la escuela vaciarlo a tiempo y evitar daños en la compuerta del recipiente.

Génesis de conciencia ecológica

En este punto existía dos decisiones para el módulo central de ConciencIA Ecológica, la primera ubicar un Jason Nano Nvidia, que condensa en su interior la cámara, la capacidad de cómputo y la posibilidad de conectar el micro controlador, o ubicar una Tablet reciclada, utilizar su cámara y alojar la capacidad de cómputo en la Tablet y que esta coordine la clasificación con las señales a los contenedores, las bocinas y las luces.

La decisión se tomó considerando la base del presupuesto que puede tener una escuela, por lo que la segunda opción parece ser la más viable, ya que por menos presupuesto se podrían llevar ConciencIA Ecológica a más escuelas. El equipo estimo 70$ considerando la donación de una Tablet reciclada.

Luego de decidir cómo realizar la clasificación, se pensó en qué se quería clasificar y utilizando la Norma Ecuatoriana INEN 2841, 2014, referente a la estandarización de colores para recipientes de depósito y almacenamiento temporal de residuos sólidos, se establecieron 5 clases: vidrio, papel, cartón, plástico, orgánico.

Que finalmente se agruparon en:

En un contenedor de color verde: Orgánicos.
En un contenedor de color azul: Plástico.
En un contenedor de color blanco. Vidrio.
En un contenedor de color gris: Cartón y Papel.
En un contenedor negro: Desechos, el cual lo establecimientos como los porcentajes de predicción más bajo que presente el modelo.

Pasos para seguir

1. Dataset

Los datos fueron seleccionados de tres fuentes: Un repositorio abierto de imágenes de desechos llamado “Waste datasets review”, en particular con el data set Trashnet, que contiene 2527 imágenes; fotos en páginas web especializadas de fotografías y fotos captadas desde el celular relacionadas con productos que se consideró etiquetar relacionadas al ámbito escolar.

El dataset se construyó con un total de 5000 imágenes en 5 clases: vidrio, papel, cartón, plástico, orgánico. Para el proyecto no se consideró la clase metal. El dataset se dividió en 80% entrenamiento y 20% para validar.

2. Procesamiento: el ABC

Esta fue la fase más larga por el tiempo invertido para hacer los cuadros delimitadores (bounding box). Para el procesamiento se utilizó LabelImg, el cual es una herramienta gratuita de anotación de imágenes gráficas disponible en pip para python3.0 o superior.

Para cada etiquetado se cuidó encerrar el objeto dentro del cuadro delimitador, lo más ajustado posible a la imagen y haciendo tantos cuadros como objetos existieran.

Ejemplo de la utilización de la herramienta LabelImg

Las imágenes fueron guardadas en formato Yolo (*.txt). Este formato establece la clase y las coordenadas de los cuadros delimitadores con la siguiente estructura:(c, xn, yn, wn, hn)

Donde:

c : es el número de la clase, en este proyecto hay 5 clases, donde c puede tomar el valor 0 para cartón, 1 papel, 2 vidrio, 3 plástico y 4 orgánico.
xn: centro del cuadro delimitador normalizado en la dirección x.
yn: centro del cuadro delimitador normalizado en la dirección y.
wn: ancho normalizado del cuadro delimitador (x).
hn: alto normalizado del cuadro delimitador (y).

3. El modelo

El modelo seleccionado fue el YOLOv5 (You Only Look Once). Este es un sistema de código abierto para la detección de objetos en tiempo real pre-entrenado con el dataset COCO, el cual hace uso de una única red neuronal convolucional (CNN) para detectar objetos en imágenes.

De acuerdo con la revisión bibliográfica, Yolo en su quinta versión es un buen algoritmo para detectar objetos en el campo de la alimentación, robótica, salud, entre otros, logrando un buen posicionamiento y reconocimiento de objetos, más precisos que otros algoritmos, incluso versiones anteriores de Yolo. Este equipo seleccionó YoloV5, por considerarlo un algoritmo robusto con buenos resultados en investigaciones recientes relacionadas con detección.

4. Resultados:

El modelo se entrenó 4 veces utilizando la técnica de “Transferencia de aprendizaje, llegando a obtener una mejora del 50% en el último entrenamiento con respecto al primero. En el modelo se usaron las siguientes variables:

Modelo: Se usó la versión Small (Yolov5s) ya que es el más rápido de entrenar y permitió tener una buena idea del comportamiento de la base de dato y del modelo frente al problema. Sin embargo, la desventaja de la rapidez es que se sacrifica precisión en comparación con otras versiones como la Extra Large (Yolov5x)
Pesos (weights): para el primer entrenamiento se utilizó los pesos predeterminados en Yolo, los cuales provienen del entrenamiento del data set COCO, llamado “yolov5.pt. Durante cada entrenamiento se generó un archivo con el mejor peso encontrado, el cual se utilizó para el siguiente entrenamiento.
Épocas: Se inició el entrenamiento con 10 épocas, llegando hasta 30 épocas.
Batch, se mantuvo fijo en 6 para todo el entrenamiento.
Tamaño de imágenes: El data set se configuro para que cada imagen tuviera un tamaño de 640 x 640.

Se aprecia las ultimas variables de entrenamiento

Los resultados de

Matriz de confusión
Precisión y Sensibilidad (Recall)

La matriz de confusión indica que tipo de error está cometiendo el modelo, en el caso de Yolo para el cálculo utiliza una confianza de 0,25 y un límite de IoU (Intersection over Union) de 0,45. Esto quiere decir que para clasificar un objeto este debe tener un 50% de probabilidad de estar en una clase.

La clase para la matriz de confusión en el cálculo de confianza de 0,25 y un límite de IoU (Intersection over Union) de 0,45

Yolo presenta su matriz en valores relativos, donde cada elemento de la matriz está normalizado al total de la columna, por lo que la suma de los valores de cada columna es igual a 1.

Para el data set, tenemos que el cartón lo clasifica relativamente bien, en el 72% de los casos reconoció esta clase, mientras el restante 24% lo clasificó como background. El vidrio lo reconoció en el 85% de los casos, mientras un 10% lo confundió con plástico quizás por la similitud de la transparencia. El papel un 59%, siendo este el valor más bajo, compartiendo un 8% con cartón, y un 32% con el background. Para el caso del plástico se obtuvo un 64% de asertividad, y el restante 34% con el background. Por último, en orgánico se obtuvo un 85% de verdaderos positivos y apenas un 13% de background.

La precisión promedio de todas las clases del modelo fue 0.748, la cual para este tipo de algoritmo es buena, nos indica que de cada 10 imágenes, aproximadamente 7 la clasifica correctamente. Su sensibilidad (Recall) fue 0.723, lo que es una buena medida de la cantidad de objetos por clase clasificados correctamente, en una clase determinada de cada 10 imágenes 7 son correctas, apenas 3 son falsos positivos.

Resultados de las métricas que nos muestra al obtener de la matriz de confusión

5. El prototipio: su crecimiento

Es importante mencionar que el alcance del proyecto se limitó a realizar el prototipado de ConciencIA Ecológica que consistió en el despliegue, la simulación de los componentes del hardware y un bosquejo de una aplicación que conecta la predicción del modelo con el hardware para clasificar imágenes de seis (6) tipos de residuos: orgánicos, vidrio, plástico, papel, cartón, desechos.

A continuación se explicará el funcionamiento del prototipo.

ConciencIA Ecológica consistirá en cinco (05) contenedores de diferentes colores y un módulo central donde se encontrará una Tablet con cámara. Los contenedores se diseñaron pensando en el tamaño de los niños y la forma más fácil de depositar el residuo en estos.

Se buscará que el aprendizaje se realice a través de la interacción del niño con los contenedores, para ello el niño presentará un residuo a la cámara de la Tablet y a través de un modelo, se podrá reconocer hasta seis (6) tipos de residuos: orgánicos, vidrio, plástico, papel, cartón y desechos en general. Luego de reconocer el residuo, se enviará la predicción a una App alojada en la Tablet en el módulo central, la cual mostrará en pantalla lo reconocido y emitirá un sonido con el nombre del material categorizado y el color del contenedor.

Se presenta un bosquejo del proceso del prototipo

Al mismo tiempo, la Tablet enviará una señal a un micro controlador para abrir el contenedor destinado a recolectar el residuo y se enviará una señal que encenderá una luz ubicada en el contenedor. La App emitirá información sobre la práctica de las 4R para promover su uso. El niño finalmente se dirigirá al contenedor señalado y deposita el residuo.

En cada contenedor se instalará un sensor ultrasónico para medir el volumen de residuos acumulados, el sensor enviará una señal a tres led´s que indicarán tres niveles: Disponible (verde), Intermedio (amarillo) y Lleno (rojo). Esto con el fin de evitar que los contenedores rebasen su capacidad, ya que, de producirse, pueden obstaculizar la apertura de la puerta con la entrada de residuos produciendo daños a los servomotores.

Estructura interna del contenedor (arriba sensor ultrasónico)

6. Despliegue

Por otro lado, la aplicación en esta fase no tendrá interacción física con el niño, por el momento servirá como centralizador de la información que viene del modelo y que dirige la acción de la apertura de los contenedores, mostrar en pantalla el resultado, emitir sonido y prender las luces de los contenedores.

La App debe ser iniciada por el administrador, el cual podrá comenzar a ejecutar Conciencia Ecológica a través de su usuario y contraseña.

Inmediatamente, se despliega un menú el cual mostrará un botón de “comenzar a reciclar” que pondrá a Conciencia Ecológica en modo de reconocimiento de residuos. Al darle al botón se enciende el sensor de aproximación y el sensor óptico (cámara); a futuro se tiene pensado implementar un módulo de estadísticas visible en el menú, a los efectos de esta idea de proyecto se colocará como deshabilitado.

Diseño de la aplicación propuesta-iniciando el proceso

En el modo reconocimiento, cuando el sensor de aproximación se activa, se mostrará un mensaje para que el niño presente el objeto a la cámara, cuando detecte el objeto se realizará la predicción.

App en Android para clasificación, mostrando la categorización en tiempo real.

Una vez realizada, se mostrará en la pantalla la clase identificada y emitirá un sonido con el nombre del contenedor, luego emitirá un corto mensaje educativo.

Diseño de la aplicación propuesta con la interacción del sonido

Al mismo tiempo la App enviará la información por bluetooth al micro controlador, el cual se encargará de abrir la compuerta correcta y emitir la señal para encender los led´s. Abajo se muestra un diagrama simulado en Tinkercad.

Su futuro: Próximos pasos

Hasta este punto, tenemos una idea de cómo Conciencia Ecológica de una forma sencilla puede orientar a los niños en la creación de hábitos para Reducir, Reutilizar, Reciclar y Recuperar. Pero…

¿hasta aquí llegamos?

A corto plazo, lo primero sería llevar esta conceptualización a la realidad, mejorando cada uno de los aspectos técnicos contemplados en el prototipo. El financiamiento de la Municipalidad de Guayaquil o una institución interesada seria la chispa para propulsar el proyecto.

A mediano plazo, aumentar la base datos e incluir otros materiales para la clasificación, como por ejemplo metal e incluso escalarse el proyecto a empresas para materiales peligrosos como baterías, bombillos ahorradores, bombillo fluorescentes, que están ocasionando un grave problema al ambiente.

En principio, el diseño de los contenedores educativos esta ajustados a las necesidades de cada región e incluso país, ya que actualmente no existe una regulación internacional que dicte las normas de los colores de los contenedores o qué tipo de material se recicla, se puede adaptar Conciencia Ecológica a las necesidades del usuario.

¿Por qué no buscamos que la inteligencia artificial le responda al niño sus inquietudes y dudas?. La App puede ser mejorada para incluir la interacción con el niño y se podría tener una conversación de reciclaje y de aspectos de interés para la educación de los niños de acuerdo a los programas educativos de cada región o país.

Pensando en el futuro de la información. El sensor ultrasónico, podría generar datos a través de la estimación de volumen de cada contenedor. Estos datos ayudarán a llevar la estadística acumulada en el tiempo, sea por contenedor y en sus 5 categorías; así como también por escuelas.

Esta información se alojará en una base de datos para posteriormente alimentar un dashboard de indicadores que permitirá su monitoreo, así como otras funcionalidades como: el control de dispositivos que no estén en funcionando; las escuelas que no están siendo proactivas; tiempo de contenedores llenos sin gestionar; entre otros. En fin una serie de indicadores primordiales, que permita a través de los entes encargados llevar un control de unidades “contenedores” por escuela e incentivar a estas para que su alumnado aprenda jugando.

Integrantes:

Luis Reyes
Lady Sangacha
Jostin Maldonado
Karely Mayorquín
Jorge Chiquito
Verónica Abad
Carlos González

Presentación del proyecto: DemoDay

Repositorio:

GitHub: https://github.com/SaturdaysAI/Projects/tree/master/LATAM_remote/ConcienciaEcologica

¡Más inteligencia artificial!

La misión de Saturdays.ai es hacer la inteligencia artificial más accesible (#ai4all) mediante cursos y programas intensivos donde se realizan proyectos para el bien (#ai4good).

Si quieres aprender más inteligencia artificial únete a nuestra comunidad en community.saturdays.ai o visítanos en nuestra web www.saturdays.ai ¡te esperamos!

Deep Learning aplicado a detección temprana de incendios forestales

9 marzo, 2022

by Info Saturdays 2021 La Paz

La Paz. Segunda Edición. 2021

En el mundo, los incendios forestales constituyen la causa más importante de destrucción de bosques. En un incendio forestal no sólo se pierden árboles y matorrales, sino también casas, animales, fuentes de trabajo e inclusive vidas humanas.

Como se puede apreciar en la Fig.1 en Bolivia los últimos siete meses este fenómeno se multiplicó de manera alarmante el área afectada debido a múltiples factores la Fig. 2 muestra algunas de las causas estudiadas para los incendios forestales. Otro factor importante identificado es el cambio climático que debido al aumento de temperatura en los lugares afectados, aumenta las áreas afectadas de manera alarmante.

Fig. 2 Causas identificadas de los incendios forestales (Vélez)

Debido a las consecuencias de los incendios forestales no controlados ni planificados se deben tomar diferentes estrategias que permitan mitigar su ocurrencia en zonas protegidas o prohibidas para esta actividad.

Descripción del problema

En base a lo mencionado anteriormente se plantea el siguiente problema:

¿Cómo identificar de manera oportuna incendios forestales no controlados para minimizar su impacto?

Objetivo general

Se plantea como objetivo general implementar un modelo de Deep Learning para la detección temprana de incendios forestales mediante el reconocimiento de humo en las áreas llanas/boscosas utilizando imágenes del lugar.

El siguiente gráfico muestra la idea central del proyecto.

Recolección de la información

El dataset para realizar el entrenamiento de los modelos se realizó mediante la descarga de imágenes clasificadas como “incendio forestal” (imágenes tomadas en perspectiva con presencia de humo en zonas forestales) y “no incendio forestal” (imágenes tomadas en perspectiva en zonas forestales sin presencia de humo o fuego).

Las imágenes descargadas (4 grupos de imágenes) fueron llevadas a un repositorio github para su importación sencilla en Google Colab.

Impresión de las 8 primeras imágenes de entrenamiento y 8 primeras imágenes de validación:

Selección de los modelos

La selección de los modelos parte de las siguientes consideraciones:

Facilidad de su implementación.
Rendimiento del modelo.
Limitación de cálculo.

Estas consideraciones son debido a los recursos que se tienen para realizar el objetivo general. Los modelos a desarrollarse son:

CCN Personalizado
VGG-16

Técnicas implementadas

La principal técnica utilizada para compensar el dataset de tamaño limitado por la limitación de búsqueda de imágenes en Google fue la de “data augmentation” realizada por la librería de keras “ImageDataGenerator”.

Evaluación de modelos

1. CNN personalizado

2. VGG-16

Análisis de resultados

A continuación se muestran los resultados del modelo CNN personalizado y VGG-16.

1. Precisión y Curva de ROC de CNN personalizado:

2. Precisión y Curva de ROC de VGG-16:

Las predicciones de los modelos a continuación:

1. CNN Personalizado

2. VGG-16

Conclusiones

El modelo CNN personalizado tiene un desempeño adecuado para la detección de incendios forestales. El modelo VGG-16 con el elemento de pre-entrenamiento requiere más elaboración para obtener resultados más precisos. De esta manera un modelo Deep Learning no siempre requiere tener una alta complejidad para realizar la clasificación de manera eficiente.

El modelo desarrollado obtiene muy buenos pronósticos para el problema planteado y es una solución complementaria al problema de incendios forestales.

La utilización de modelos de AI Deep Learning pueden ser mejor explotados como complemento a la solución de problemas coyunturales.

Integrantes

Daniel Blanco

Presentación del proyecto: DemoDay

¡Más Inteligencia Artificial!

La misión de Saturdays.ai es hacer la inteligencia artificial más accesible (#ai4all) mediante cursos y programas intensivos donde se realizan proyectos para el bien (#ai4good).

Si quieres aprender más inteligencia artificial únete a nuestra comunidad en community.saturdays.ai o visítanos en nuestra web www.saturdays.ai ¡te esperamos!