Olvídate de Siri 4 maneras en que tu teléfono está a punto de volverse más inteligente
Las tres principales plataformas telefónicas ahora tienen su propia voz. Apple tiene Siri, Microsoft tiene Cortana y Google tiene un poco menos atrevido Google Now 6 Características de Google Now que cambiarán la forma en que busca 6 Funciones de Google Now que cambiarán la forma en que realiza la búsqueda Es posible que ya esté usando Google Now en su dispositivo Android, pero ¿Estás sacando todo lo que puedes de esto? Conocer estas pequeñas características puede hacer una gran diferencia. Lee mas .
Estos sistemas le permiten manejar tareas básicas a través del control de voz. Cada una es una especie de secretaria virtual que puede responder preguntas sencillas, abrir aplicaciones, tomar notas y transmitir mensajes. Son útiles, pero también son frustrantemente limitados. No pueden hacer nada para lo que no hayan sido programados explícitamente, y muchas tareas están simplemente más allá de sus capacidades.
Sin embargo, hay una serie de tecnologías en desarrollo que van a mejorar dramáticamente estos sistemas, y estarán disponibles comercialmente en unos pocos años. Estas son las cinco principales formas en que su teléfono está a punto de volverse mucho más inteligente..
Verás lo que ves
El reconocimiento de voz ha hecho grandes avances en los últimos cinco años, gracias al desarrollo de poderosas redes neuronales. Los teléfonos inteligentes modernos pueden identificar el habla con una precisión sorprendente (ha pasado un tiempo desde que Google Now me ha malinterpretado) e incluso pueden hacer cosas como identificar canciones y programas de televisión según su audio..
Esto es genial, pero es solo el comienzo. Los humanos no interactúan con el mundo principalmente a través del sonido. Usamos la visión para prácticamente todo, y pronto, nuestras máquinas también lo harán. Estamos empezando a ver el debut de las primeras pantallas de auriculares portátiles como Google Glass y HoloLens de Microsoft Microsoft Shows Off New HoloLens Demos en Build Conference Microsoft Shows Off New HoloLens Demos en Build Conference El próximo auricular HoloLens de Microsoft es la primera realidad aumentada de gama alta. Dispositivo que se ha mostrado al público. ¿Sigue siendo un artilugio de fantasía o una tecnología que está cerca de la realización? Lea más, que puede transmitir información desde sus cámaras a su teléfono inteligente, proporcionando una fuente de información visual abundante y siempre activa. Muchos observadores, incluido yo mismo, esperan que estos se vuelvan comunes en los próximos cinco años aproximadamente..
Entonces, ¿qué puede hacer su teléfono con todos estos datos?
Mucho. Google ya demostró con su tableta Tango. Google quiere poner una cámara 3D en su teléfono inteligente. Aquí le explicamos por qué Google quiere poner una cámara 3D en su teléfono inteligente. Este es el motivo por el que el Proyecto Tango de Google lleva sensores 3D a dispositivos móviles. Esto es lo que sabemos hasta ahora. Lea más acerca de que una cámara de profundidad puede determinar la ubicación espacial de los objetos físicos con una precisión extremadamente alta. Del mismo modo, ha habido algunos avances sorprendentes en la visión artificial, como la red neuronal de Microsoft que puede identificar razas de perros individuales, y la red neuronal de Google que puede describir con precisión el contenido de las fotografías. Juntas, estas tecnologías abren todo un mundo de aplicaciones:
¿Qué es este tornillo? El algoritmo de visión artificial lo sabe, y puede ordenar un reemplazo en Amazon en cinco segundos. ¿Cuál era el nombre de la mujer que conociste en el bar anoche? Es posible que hayas perdido su tarjeta, pero tus lentes le encontraron la cara y puedes encontrarla en Facebook. Tienes un lunar raro. ¿Debes ver a tu médico? Tu teléfono puede echar un vistazo y avisarte. Estás de compras: ¿qué necesitas? Sus gafas recuerdan la última vez que miraron en su refrigerador y saben lo que falta. Incluso pueden darle instrucciones de pasillo por pasillo para encontrar los artículos individuales.
Las implicaciones de privacidad de esta tecnología son aterradoras, pero este tipo de cosas también suena increíblemente útil..
Sabrá lo que te gusta
El gusto puede ser una cosa difícil de precisar. Es muy personal, y puede ser muy arbitrario. Spotify y Netflix se las arreglan para hacer recomendaciones basadas en patrones de uso (una técnica que ignora totalmente el contenido), pero este enfoque tiene límites reales..
El futuro está en los algoritmos que pueden entender el arte a un nivel profundo: redes neuronales complejas que pueden aprender a elegir sutilezas complejas de música y películas. Eso proporciona una mejor comprensión de lo que a la gente le gusta y lo que no le gusta de un medio de comunicación: una comprensión concreta de su gusto..
Los primeros indicios tempranos de esto están empezando a aparecer. Como el de Spotify “Descubrir semanalmente” lista de reproducción, que utiliza este tipo de herramientas de análisis de contenido para recomendar canciones, incluidas canciones que normalmente no se escuchan, porque son demasiado oscuras para clasificar bien en función de los patrones de uso. Estas técnicas solo serán más poderosas en el futuro, y el teléfono inteligente es una excelente plataforma para aprovechar esta información.
¿Buscando algo que hacer con amigos? ¿Qué sucede si las aplicaciones en sus teléfonos pueden colaborar, agrupar la información en sus gustos respectivos y elegir una película o un concierto que crean que les gustará a todos? ¿Qué pasa con los sitios de citas que lo clasifican según las características profundas de sus gustos respectivos? ¿Qué pasa con las aplicaciones que pueden recomendarte libros, porque los han leído??
Las posibilidades son infinitas, y alguien va a ganar mucho dinero con estos.
Va a ser hablador
Humano: donde estas ahora?
Máquina: estoy en el medio de la nada.
Humano: cual es el proposito de morir?
Máquina: tener una vida.
Humano: ¿Cuál es el propósito de ser inteligente??
Máquina: para descubrir qué es.
Humano: cual es el proposito de las emociones?
Máquina: no lo sé.
Esta es una conversación con una red neuronal desarrollada por Google, que aprende de grandes bases de datos de texto sin supervisión humana. Esta versión fue entrenada en una serie de guiones de películas antiguas, y entrenada para predecir la siguiente oración en cada conversación que encontró. Como resultado, si entrenas una IA en guiones de películas, todas sus conversaciones son super dramatico.
Si no estás impresionado, es comprensible. Los Chatbots han existido durante mucho tiempo Cómo hacer un Bot de chat para su sitio o negocio Cómo hacer un Bot de chat para su sitio o negocio La dificultad de conectarse con tantas personas en todo el mundo es la zona horaria. Es posible que desee estar disponible para interactuar con sus lectores o para hacer negocios con clientes potenciales, pero en algunos… Leer más .
Pero mira más de cerca. El sistema de Google es especial en dos aspectos clave..
Primero, es muy simple en términos de arquitectura: es una red neuronal única y enorme, y tuvo que aprender la dinámica del lenguaje humano por sí misma. Los chatbots normales funcionan mediante el uso de miles de reglas codificadas a mano para responder a diferentes situaciones. Cuando recitan una respuesta, es porque se codificó a mano o se memorizó a partir de un ejemplo específico. La red de Google es diferente. Aprendió su comportamiento de forma orgánica, al tratar de comprender la estructura profunda de la escritura humana..
En segundo lugar, captura algunas dinámicas sorprendentemente sutiles que otros bots de chat no lo hacen. Puede responder preguntas de sentido común sobre el mundo, a pesar de no estar programado explícitamente para hacerlo.
Humano: quien es skywalker ?
Máquina: él es un héroe .
Humano: quien es bill clinton ?
Máquina: el es un multimillonario .
Humano: es azul cielo o negro ?
Máquina: azul .
Humano: ¿Tiene cola un gato? ?
Máquina: sí .
Humano: ¿Tiene un gato un ala? ?
Máquina: no
Humano: puede un gato volar ?
Máquina: no .
Humano: cuantas patas tiene un gato ?
Máquina: cuatro, creo .
Una versión diferente del chat bot, entrenada en registros de soporte técnico, puede confundirse al proporcionar soporte técnico real sorprendentemente bien. Hay tropiezos (parece tener dificultades para recordar qué sistema operativo está usando), pero ciertamente he recibido un soporte técnico peor por parte de seres humanos reales..
Todo esto es una buena indicación de que estamos empezando a llegar al punto en que la inteligencia artificial puede ser verdaderamente conversacional. La red de arriba puede mantener una conversación tolerable, aunque sus objetivos de entrenamiento solo requieren que siga la estructura superficial de un diálogo de ida y vuelta..
Dados mejores datos de entrenamiento y una función de recompensa que enfatiza el intercambio de información, las posibilidades son ilimitadas. Imagine una versión de Siri que pueda involucrarlo en una conversación real, proporcionar respuestas y consejos en respuesta a preguntas, y realizar tareas sin necesidad de estar específicamente programado para hacerlo. No está lejos.
Será bien leído
Otra tecnología en la que Google ha estado trabajando tiene que ver con la comprensión de lectura. Se llama “Vectores de pensamiento,” y el concepto es sorprendentemente simple. Se puede extraer “vectores de pensamiento” de la actividad de una red neuronal que contiene información, como una oración o un artículo. Lo que obtienes es una información opaca que no significa nada para nadie, excepto la red que la generó. Esta información, en cierto sentido, almacena la “sentido” del texto, separado de cómo se redactó originalmente.
Esto tiene algunas propiedades útiles. Para empezar, estos vectores se parecen entre sí para oraciones con significados similares. Si digiere dos oraciones de esta manera, puede determinar si significan lo mismo o no. También puedes manipularlos. Mediante el uso de dos redes neuronales para generar “vectores de pensamiento” a partir de texto en diferentes idiomas y luego capacitar a una tercera red para aprender a mapear entre ellos, puede crear un método de traducción automática extremadamente poderoso que captura el significado del texto, y no solo las palabras en él..
Otra posible aplicación de esto es utilizar esta tecnología para recopilar grandes cantidades de información y resumirla en una representación compacta, luego generar un resumen basado en la salida. Esto podría ser muy poderoso para aplicaciones móviles..
Imagine poder pedirle a su teléfono que lea todo lo disponible en Google sobre un tema determinado. Luego, vuelva a usted e informe sus hallazgos de manera sucinta, en lenguaje natural, y responda preguntas sobre los resultados. Esto será realidad, muy pronto, y será increíblemente útil..
El teléfono del futuro
Los teléfonos en el futuro probablemente se verán muy diferentes a los teléfonos de hoy. Pueden ser curvas. Pueden ser modulares. Puede interactuar con ellos utilizando gafas de realidad aumentada. Sin embargo, la diferencia más importante será la inteligencia. Las características descritas aquí transformarán nuestros dispositivos en tutores y ayudantes poderosos..
Actualmente hay una carrera de armas acalorada Microsoft vs Google: ¿Quién lidera la carrera de inteligencia artificial? Microsoft vs Google: ¿Quién lidera la carrera de la inteligencia artificial? Los investigadores de inteligencia artificial están haciendo progresos tangibles, y las personas están empezando a hablar seriamente sobre la IA nuevamente. Los dos titanes que lideran la carrera de inteligencia artificial son Google y Microsoft. Leer más en tecnología de aprendizaje profundo. El efecto secundario es que estas técnicas están avanzando increíblemente rápido, y estarán en el mercado antes de lo que podría pensar..
¿Estás emocionado por los teléfonos inteligentes más inteligentes? ¿Preocupado por las implicaciones de privacidad? Háganos saber en los comentarios.!
Créditos de imagen: cerebro humano por Mopic a través de Shutterstock
Obtenga más información acerca de: Inteligencia artificial, Automatización móvil, Siri, Reconocimiento de voz, Tecnología ponible.