Home Economía Gracias al dictado de voz con IA, más personas hablan sobre sus...

Gracias al dictado de voz con IA, más personas hablan sobre sus correos electrónicos, mensajes y códigos

52

Gavin McNamara ha abandonado su teclado y se pasa todo el día hablando en lugar de escribir.

Habla durante horas en su computadora y teléfono, envía correos electrónicos, escribe presentaciones, publica en LinkedIn e incluso codifica conversaciones usando una aplicación de dictado de inteligencia artificial de la startup Wispr Flow de San Francisco.

La IA puntúa, da forma y adapta tus divagaciones en una copia coherente. McNamara promedia 125 palabras por minuto, que es el doble de la velocidad promedio de escritura.

“A estas alturas, todo lo que se puede hacer escribiendo, lo hago hablando”, dijo este hombre de 32 años, fundador de la agencia de software Why Not Us. “Sólo estoy hablando”.

En 77 solicitudes, ha dictado cerca de 300.000 palabras en los últimos cinco meses, lo que equivale a escribir tres novelas.

Los titanes tecnológicos y las nuevas empresas de California están a la vanguardia de un movimiento para utilizar la inteligencia artificial y los grandes modelos de lenguaje en los que confían para impulsar a las personas a interactuar con la tecnología usando sus voces en lugar de sus dedos.

“La IA y los LLM han cambiado la dinámica”, dijo CJ Pais, creador de la aplicación gratuita de dictado de voz a texto Handy, con sede en San Diego. “Usar la voz es mucho más rápido que escribir”.

Ha surgido una combinación de desarrolladores independientes y nuevas empresas, incluidas Handy, Wispr Flow y Willow de San Francisco, entre otras, para proporcionar una interacción de voz precisa con inteligencia artificial.

Los nombres más importantes de la tecnología también están creando nuevas formas para que las personas interactúen con la IA. Las últimas gafas inteligentes de Meta se basan en voz. OpenAI y Meta han diseñado diferentes personalidades para los chats de voz de sus bots. Incluso Alexa de Amazon y Siri de Apple están experimentando actualizaciones de IA, que las compañías anticipan harán que todos hablen mucho más con su tecnología.

Estos métodos gratuitos y de pago para utilizar palabras habladas con computadoras han atraído a millones de usuarios, incluidos codificadores, asistentes ejecutivos, abogados, creadores de contenido y médicos. Algunos optimistas piensan que el teclado podría quedar obsoleto.

“Me emociona anunciar que hemos retirado los teclados de los premios televisivos más prestigiosos del mundo”, dijo Allan Guo, fundador de Willow, en una publicación en LinkedInseñalando que el equipo de los Premios Emmy utilizó el dictado de voz de Willow para enviar mensajes de Slack y limpiar bandejas de entrada más rápido en preparación para los premios de 2026.

A lo largo de los años, las grandes empresas tecnológicas han hecho precisamente eso adaptado muchos de sus productos cuentan con funciones de voz, para mayor comodidad. El giro actual de la voz en función de la accesibilidad a una herramienta de productividad.

A finales de 2022, el creador de ChatGPT comenzó a regalar acceso sin restricciones a su modelo de reconocimiento automático de voz llamado Whisper, entrenado con 680.000 horas de datos multilingües. OpenAI compartió la tecnología para una transcripción de audio precisa, que alguna vez fue un gran secreto tecnológico celosamente guardado. Ahora cualquiera puede descargar y ejecutar transcripciones de IA de alta calidad de forma gratuita en tu computadora portátil.

La nueva ola de aplicaciones de dictado con IA utiliza Whisper como base y se basa en él para ofrecer dictados en vivo. Si bien existen alternativas gratuitas, la suscripción paga cuesta entre $8 y $12 por mes.

El dictado basado en IA está ganando terreno entre los programadores y los usuarios habituales, lo que hace que la gente hable con sus portátiles. Ya sea escribir correos electrónicos, enviar SMS, diseñar un sitio web o asignar tareas de inteligencia artificial, los primeros usuarios dicen que el dictado les permite trabajar más rápido, pensar con mayor claridad y ser más productivos.

“Las personas que han adoptado mucho la voz no van a volver atrás. Cuando hablas 20 horas a la semana en tu computadora portátil, escribir se siente como una fricción”, dijo Naveen Naidu, director ejecutivo de la aplicación de dictado de voz Monologo, con sede en Nueva York. “Hacia dónde creo que se dirige: la voz se convierte en la capa de delegación. Uno expresa su intención y las cosas suceden”.

Estas nuevas aplicaciones de dictado con IA aprovechan la tecnología de Apple chips avanzados en iPhones y Macs para ejecutar dictados privados en el dispositivo.

Geoffrey Huntley, un desarrollador de software independiente, pasó casi por completo a la voz para trabajar en junio.

A menudo inicia proyectos abriendo un mensaje de voz y pidiendo a la IA que lo entreviste sobre sus inquietudes y requisitos del proyecto antes de generar cualquier código.

“Hablo de ello, como si estuviera tocando riffs en una banda de jazz, hacia atrás, hacia adelante, hacia atrás, hacia adelante”, dijo Huntley. Este baile vocal ayuda a refinar las especificaciones, luego la IA toma el volante. y construir software.

Más allá de la codificación, Huntley usa la voz para “dejarlo explotar” al capturar ideas para publicaciones o mensajes de blogs, usando aplicaciones como súper susurro o Whisper Flow para obtener una “primera dosis” de pensamientos antes de pasar al teclado para la edición final.

Un número cada vez mayor de desarrolladores de software en Silicon Valley dictan instrucciones de codificación durante horas seguidas en lugar de escribirlas. La combinación de agentes de IA que avanzan rápidamente y que pueden codificar horasCon la entrada de voz que captura pensamientos más rápido que escribir, su productividad ha aumentado.

El “codificador de vibraciones” McNamara creó más de 25 aplicaciones web en unos pocos meses, una velocidad de desarrollo que sería imposible sin instrucciones de voz.

“No creo que (escribir) sea tan eficiente o efectivo para llegar tan rápido como lo hice hablando”, dijo McNamara.

Se utilizó una conversación sinuosa y unas pocas horas para crear la IA. Regalos brotesuna lista de regalos para niños y una aplicación para Califica cualquier artículo usando fotos.

Por cierto, la IA puede cometer errores y es necesario comprobar su funcionamiento.

Mientras tanto, la adopción generalizada ha traído consigo nuevos obstáculos, ya que incluso los usuarios avanzados se sienten incómodos hablando en sus computadoras portátiles. Las oficinas abiertas y abarrotadas no están diseñadas para que muchas personas conversen en sus computadoras al mismo tiempo.

“Me encanta la voz, pero no en la oficina”, dijo uno usuario a X. “No me gusta hablar con otras personas. Lo haría en una oficina a puerta cerrada o iría a trabajar en mi coche”.

McNamara usa auriculares para que la gente suponga que está atendiendo una llamada.

“Es como el truco social que tengo”, dijo.

Si bien es demasiado pronto para decir si el teclado Qwerty podría seguir a las máquinas de cinta y de fax hasta quedar obsoletos, la velocidad hacia la voz se está acelerando, dijo Dylan Fox, fundador de Assembly AI, con sede en San Francisco, que proporciona modelos de audio a empresas.

“Definitivamente estamos en el comienzo de lo que consideramos un aumento de 10 a 100 veces en la demanda de interfaces y aplicaciones de voz e inteligencia artificial”, dijo.

Para el programador McNamara, hablar más con los chatbots los ha convertido en mejores amigos.

Solía ​​​​ser malo respondiendo mensajes de texto. Ahora vuelve con tus amigos de inmediato.

“Soy tan rápido en responder que dicen ‘¿Quién es este tipo?'”, dijo.

Enlace fuente