Viernes 21 de Marzo de 2025

Hoy es Viernes 21 de Marzo de 2025 y son las 05:01 - ¡Hola! Bienvenido a mi sitio web. Te invito a recorrer las secciones.

  • 23.3º

23.3°

CABA

INTERNET

17 de diciembre de 2024

Google presenta Whisk, su nueva IA capaz de crear videos usando imágenes

Los usuarios cuentan con la posibilidad de subir sus propias fotografías o generarlas con inteliegencia artificial

>La plataforma funciona en tres etapas: el sujeto del video, la escena y el estilo. En cada uno de estos pasos, los usuarios pueden:

    Por último, deben ingresar una descripción que complemente la creación del video. Si el resultado no es el esperado, Whisk incluye la opción ‘Refine’, que permite realizar ajustes. Al seleccionar esta función, los usuarios pueden agregar una nueva descripción con los cambios deseados. Una vez finalizado, solo deben pulsar el ícono de descarga (una flecha hacia abajo) para guardar el video.

    Para ingresar a Whisk, la nueva IA de Google, los usuarios deben ingresar a la siguiente página: https://blog.google/technology/google-labs/whisk/.

    Deben iniciar sesión con una cuenta personal de Google así como encontrarse en Estados Unidos, es el único país en el que esta herramienta se encuentra disponible, por el momento.

    “En Google Labs, desarrollamos experimentos con los últimos modelos de IA generativa, como Gemini, Imagen y Veo. Nuestro objetivo es recibir comentarios sobre nuevos productos y funciones, mientras trabajamos en conjunto para dar forma a la tecnología”, explicaron Thomas Iljic, director de gestión de productos en Google Labs, y Nicole Brichtova, gerente de producto en Google DeepMind.

    Dado que Whisk es un experimento reciente de Google Labs, Iljic y Brichtova advierten que la herramienta “extrae solo algunas características clave de la imagen, por lo que es posible que genere resultados que difieran de las expectativas”.

    No obstante, en sus primeras pruebas con artistas y creativos, Whisk ha sido descrito como una herramienta creativa innovadora, y no como un editor de imágenes tradicional.

    “Lo diseñamos para facilitar una exploración visual rápida, no para lograr ediciones perfectas. Se trata de explorar ideas de formas nuevas y creativas, permitiéndote trabajar con docenas de opciones y descargar las que más te gusten”, afirmaron los responsables del proyecto.

    Gemini 2.0 es el modelo de inteligencia artificial más avanzado y rápido hasta la fecha de Google. Esta IA permite realizar múltiples tareas simultáneamente con mayor autonomía, reduciendo la necesidad de supervisión humana.

    Según Sundar Pichai, director ejecutivo de Google y Alphabet, “si Gemini 1.0 se centraba en organizar y comprender la información, Gemini 2.0 se centra en hacerla mucho más útil”.

    Demis Hassabis, director ejecutivo de Google DeepMind, y Koray Kavukcuoglu, director de tecnología de Google DeepMind, explican que este modelo puede admitir entradas multimodales como imágenes, video y audio, y generar resultados en varios formatos.

    Los ejecutivos de Google señalaron que pronto estará disponible en la aplicación móvil de Gemini y que a principios del próximo año se ampliará Gemini 2.0 a más productos de Google.

    COMPARTIR:

    Notas Relacionadas

  • Desarrollado por
  • RadiosNet