ChatGPT ahora podrá escuchar, hablar y trabajar con imágenes

OpenAI anunció que se vienen dos grandes actualizaciones para su producto estrella, Chat GPT; se trata de dos opciones muy esperadas por los usuarios: escuchar, hablar y además entender imágenes.

ChatGPT / Getty Images

Juan Manuel Acosta JuanMa5 acostajuanm_

26/09/2023 - 16:28 GMT-5

Para los que no lo tenían en el radar, ChatGPT es un sistema de chat basado en el modelo de lenguaje por Inteligencia Artificial GPT-3, desarrollado por OpenAI. Esta compañía también es recordada por generar contenidos para la plataforma Playground. Cabe recordar que, este modelo cuenta con más de 175 millones de parámetros, entre los que se encuentran grandes cantidades de texto para sostener conversaciones y realizar tareas con el lenguaje, desde la traducción hasta la generación de texto.

Ahora bien, teniendo en cuenta lo anterior, se confirmó que la famosa aplicación podrá entender y transmitir audio similar al que produce un humano, mediante la colaboración de cinco actores de doblaje profesional. De igual manera, también realizará la transcripción de la información en pocos segundos y utilizará el sistema Whisper, una red neuronal que trata de asemejar los sistemas de reconocimiento humano, para brindar una mejor experiencia al usuario a la ahora de reconocer la voz.

Por eso, a través de redes sociales, se brindó un ejemplo de la nueva función en donde se le solicita a la inteligencia artificial que narre una historia sobre el “Genial erizo Larry” y en cuestión de segundos lo hizo.

Más información

Otras funciones interesantes

Además, con las nuevas opciones de ChatGPT se podrán entender imágenes, de manera que el usuario podrá subir una o más imágenes a la aplicación, incluso editando la imagen para centrar la atención en algún punto específico.

“Solucione problemas por los que su parrilla no arranca, explore el contenido de su refrigerador para planificar una comida o analice un gráfico complejo en busca de datos relacionados con el trabajo”, dice OpenAI en su página oficial para presentar su nueva función.

Esta herramienta tendrá la posibilidad de entender imágenes, fotografías, capturas de pantalla y documentos que contienen texto e imágenes.

Así pues, durante las próximas dos semanas llegarán las actualizaciones a las diferentes plataformas; los usuarios de Android y IOS serán los únicos que podrán, por el momento, utilizar la función de voz; sin embargo, las imágenes estarán disponibles para todos los dispositivos.

Google Bard: qué es, cómo funciona y qué puede hacer con la IA que compite con ChatGPT

Pasando a otros temas, se trata de otra Inteligencia Artificial creada por Google, que usa algoritmos de aprendizaje profundo para proporcionar respuestas claras a mensajes escritos por los usuarios. Bard llega como un complemento del buscador y servirá como un competidor directo para ChatGPT.

Como era de esperarse, dicha herramienta se actualizará de manera constante recopilando la información que encuentre en línea para ser lo más preciso posible. Así las cosas, al buscar cualquier término en la plataforma, lo primero que saldrá serán sus posibles respuestas y más tarde como insumos adicionales, todos los enlaces sobre la información buscada.

Bard está basado en LaMDA, que significa Language Model for Dialogue Applications. Se trata de una familia de modelos de lenguaje neuronal conversacional desarrollado por Google. Cabe recordar que, este modelo llevaba un tiempo en fase de pruebas y unas pocas personas tenían el acceso completo a sus ventajas.