Cómo los robots están aprendiendo a leer y pensar
Hablamos todo el tiempo sobre computadoras que nos entienden. Nosotros decimos que Google “sabía” Lo que buscábamos, o esa Cortana. “tiene” lo que decíamos, pero “comprensión” Es un concepto muy difícil. Especialmente cuando se trata de computadoras..
Un campo de la lingüística computacional, llamado procesamiento natural del lenguaje (PNL), está trabajando en este problema particularmente difícil. Es un campo fascinante en este momento, y una vez que tengas una idea de cómo funciona, comenzarás a ver sus efectos en todas partes..
Una nota rápida: Este artículo tiene algunos ejemplos de una computadora que responde al habla, como cuando le preguntas algo a Siri. La transformación del habla audible a un formato comprensible por computadora se llama reconocimiento de voz. A la PNL no le preocupa eso (al menos en la capacidad que estamos discutiendo aquí). La PNL solo entra en juego una vez que el texto está listo. Ambos procesos son necesarios para muchas aplicaciones, pero son dos problemas muy diferentes.
Definiendo el entendimiento
Antes de ver cómo las computadoras manejan el lenguaje natural, necesitamos definir algunas cosas.
En primer lugar, necesitamos definir el lenguaje natural. Esto es fácil: todos los idiomas utilizados regularmente por las personas entran en esta categoría. No incluye cosas como lenguajes construidos (klingon, esperanto) o lenguajes de programación de computadoras. Usas lenguaje natural cuando hablas con tus amigos. Probablemente también lo uses para hablar con tu asistente personal digital..
Entonces, ¿qué queremos decir cuando decimos comprensión? Bueno, es complejo. ¿Qué significa entender una oración? Tal vez diría que significa que ahora tiene el contenido deseado del mensaje en su cerebro. Entender un concepto puede significar que puedes aplicar ese concepto a otros pensamientos.
Las definiciones del diccionario son nebulosas. No hay una respuesta intuitiva. Los filósofos han discutido sobre cosas como esta durante siglos..
Para nuestros propósitos, vamos a decir que la comprensión es La capacidad de extraer con precisión el significado del lenguaje natural.. Para que una computadora lo entienda, necesita procesar con precisión un flujo de voz entrante, convertir ese flujo en unidades de significado y poder responder a la entrada con algo que sea útil.
Obviamente todo esto es muy vago. Pero es lo mejor que podemos hacer con un espacio limitado (y sin un título en neurofilosofía). Si una computadora puede ofrecer una respuesta similar a la humana, o al menos útil, a un flujo de información en lenguaje natural, podemos decir que lo entiende. Esta es la definición que usaremos en el futuro..
Un problema complejo
El lenguaje natural es muy difícil de manejar para una computadora. Tu podrias decir, “Siri, dame direcciones para Punch Pizza,” mientras que podría decir, “Siri, Punch Pizza ruta, por favor..”
En su declaración, Siri podría escoger la frase clave “dame direcciones,” A continuación, ejecute un comando relacionado con el término de búsqueda “Punch Pizza.” En la mía, sin embargo, Siri necesita elegir “ruta” como la palabra clave y saber que “Punch Pizza” es donde quiero ir, no “Por favor.” Y eso es solo un ejemplo simplista..
Piense en una inteligencia artificial que lee los correos electrónicos y decide si pueden o no ser estafas. O uno que supervisa las publicaciones de los medios sociales para medir el interés en una empresa en particular. Una vez trabajé en un proyecto en el que teníamos que enseñar a una computadora a leer notas médicas (que tienen todo tipo de convenciones extrañas) y obtener información de ellas..
Esto significa que el sistema tenía que poder lidiar con abreviaturas, sintaxis extrañas, errores ortográficos ocasionales y una amplia variedad de otras diferencias en las notas. Es una tarea muy compleja que puede ser difícil incluso para los humanos experimentados, y mucho menos para las máquinas..
Poniendo un ejemplo
En este proyecto en particular, formé parte del equipo que estaba enseñando a la computadora a reconocer palabras específicas y las relaciones entre palabras. El primer paso del proceso fue mostrar a la computadora la información que contenía cada nota, por lo que anotamos las notas..
Había un gran número de diferentes categorías de entidades y relaciones. Toma la frase “El dolor de cabeza de la Sra. Green fue tratado con ibuprofeno.,” por ejemplo. Sra. Green fue etiquetado como una persona, dolor de cabeza fue etiquetado como SIGNO O SINTOMA, ibuprofeno fue etiquetado como MEDICACIÓN. Luego, la Sra. Green se vinculó al dolor de cabeza con una relación de PRESENTES. Finalmente, el ibuprofeno se relacionó con el dolor de cabeza con una relación de TRATAMIENTOS.
Etiquetamos miles de notas de esta manera. Codificamos diagnósticos, tratamientos, síntomas, causas subyacentes, comorbilidades, dosis y todo lo que pueda pensar relacionado con la medicina. Otros equipos de anotación codificaron otra información, como la sintaxis. Al final, tuvimos un corpus lleno de notas médicas que la IA pudo “leer.”
La lectura es tan difícil de definir como la comprensión. La computadora puede ver fácilmente que el ibuprofeno trata un dolor de cabeza, pero cuando aprende esa información, se convierte en unos y ceros sin sentido (para nosotros). Ciertamente, puede devolver información que parece humana y es útil, pero ¿eso constituye entender lo que la Inteligencia Artificial no es lo que la Inteligencia Artificial no es lo que los robots inteligentes y sensibles van a conquistar el mundo? Hoy no, y tal vez nunca. Lee mas ? De nuevo, es en gran parte una cuestión filosófica..
El aprendizaje real
En este punto, la computadora revisó las notas y aplicó una serie de algoritmos de aprendizaje automático. 4 Algoritmos de aprendizaje automático que dan forma a su vida. 4 Algoritmos de aprendizaje automático que configuran su vida. Es posible que no se dé cuenta, pero el aprendizaje automático ya está a su alrededor. Puede ejercer un grado sorprendente de influencia sobre su vida. No me crees Te sorprenderías. Lee mas . Los programadores desarrollaron diferentes rutinas para etiquetar partes del habla, analizar dependencias y constituyentes y etiquetar roles semánticos. En esencia, la IA estaba aprendiendo a “leer” las notas.
Los investigadores eventualmente podrían probarlo dándole una nota médica y pidiéndole que etiquete cada entidad y relación. Cuando la computadora reprodujo con precisión las anotaciones humanas, se podría decir que aprendió a leer dichas notas médicas..
Después de eso, solo se trataba de recopilar una gran cantidad de estadísticas sobre lo que había leído: qué medicamentos se usan para tratar qué trastornos, qué tratamientos son más efectivos, las causas subyacentes de conjuntos específicos de síntomas, etc. Al final del proceso, la AI podría responder preguntas médicas basadas en la evidencia de notas médicas reales. No tiene que depender de libros de texto, compañías farmacéuticas o intuición..
Aprendizaje profundo
Veamos otro ejemplo. La red neuronal DeepMind de Google está aprendiendo a leer artículos de noticias. Al igual que la IA biomédica anterior, los investigadores querían que extrajera información relevante y útil de fragmentos de texto más grandes.
El entrenamiento de una IA en información médica fue lo suficientemente difícil, por lo que puedes imaginar la cantidad de datos anotados que necesitarías para que una AI pueda leer artículos de noticias generales. Contratar suficientes anotadores y pasar por suficiente información sería prohibitivamente costoso y requeriría mucho tiempo.
Así que el equipo de DeepMind recurrió a otra fuente: sitios web de noticias. Específicamente, CNN y el Daily Mail..
¿Por qué estos sitios? Porque proporcionan resúmenes puntiagudos de sus artículos que no simplemente extraen oraciones del artículo en sí. Eso significa que la IA tiene algo de qué aprender. Los investigadores básicamente le dijeron a la IA, “Aquí hay un artículo y aquí está la información más importante en él..” Luego le pidieron que extrajera el mismo tipo de información de un artículo sin puntos destacados..
Este nivel de complejidad puede ser manejado por una red neuronal profunda, que es un tipo especialmente complejo de sistema de aprendizaje automático. (El equipo de DeepMind está haciendo cosas increíbles en este proyecto. Para obtener información específica, consulte esta excelente descripción general de la Revisión de tecnología del MIT).
¿Qué puede hacer una AI de lectura??
Ahora tenemos una comprensión general de cómo las computadoras aprenden a leer. Toma una gran cantidad de texto, le dice a la computadora lo que es importante y aplica algunos algoritmos de aprendizaje automático. Pero, ¿qué podemos hacer con una IA que extrae información del texto??
Ya sabemos que puede extraer información procesable específica de notas médicas y resumir artículos de noticias generales. Hay un programa de código abierto llamado P.A.N. que analiza la poesía sacando temas e imágenes. Los investigadores a menudo utilizan el aprendizaje automático para analizar grandes cuerpos de datos de redes sociales, que utilizan las empresas para comprender los sentimientos de los usuarios, ver de qué hablan las personas y encontrar patrones útiles para el marketing..
Los investigadores han utilizado el aprendizaje automático para comprender mejor los comportamientos del correo electrónico y los efectos de la sobrecarga del correo electrónico. Los proveedores de correo electrónico pueden usarlo para filtrar el spam de su bandeja de entrada y clasificar algunos mensajes como de alta prioridad. Leer AIs es fundamental para hacer un servicio eficaz al cliente. Chatbots 8 Bots que debe agregar a su aplicación de Facebook Messenger 8 Bots que debe agregar a su aplicación de Facebook Messenger Facebook Messenger se ha abierto a los bots de chat, lo que permite a las empresas brindar servicio al cliente, noticias y más directamente a usted a través de la aplicación. Éstos son algunos de los mejores disponibles. Lee mas . En cualquier lugar donde haya texto, hay un investigador que trabaja en el procesamiento del lenguaje natural..
Y a medida que este tipo de aprendizaje automático mejora, las posibilidades solo aumentan. Las computadoras son mejores que los humanos en el ajedrez, el Go y los videojuegos ahora. Pronto podrán ser mejores para leer y aprender. ¿Es este el primer paso hacia una IA fuerte? Aquí está la razón por la que los científicos creen que debería preocuparse por la inteligencia artificial Por qué los científicos piensan que debería preocuparse por la inteligencia artificial ¿Cree que la inteligencia artificial es peligrosa? ¿La IA puede suponer un grave riesgo para la raza humana? Estas son algunas de las razones por las cuales usted puede querer preocuparse. Lee mas ? Tendremos que esperar y ver, pero puede ser.
¿Qué tipo de usos ves para una IA de aprendizaje y lectura de texto? ¿Qué tipo de aprendizaje automático crees que veremos en un futuro cercano? Comparte tus pensamientos en los comentarios a continuación!
Créditos de la imagen: Vasilyev Alexandr / Shutterstock
Explorar más sobre: Inteligencia Artificial, Futurología..