Cómo las matemáticas del espacio vectorial ayudan a las máquinas a detectar el sarcasmo

En 1970, la activista social Irina Dunn garabateó un eslogan en la parte posterior de la puerta de un baño en la Universidad de Sydney. Decía: Una mujer necesita a un hombre como un pez necesita una bicicleta. La frase se volvió viral y eventualmente se convirtió en un estribillo famoso para el creciente movimiento feminista de la época.



La frase también es un ejemplo de sarcasmo. El humor proviene del hecho de que un pez no necesita una bicicleta. La mayoría de los humanos tienen pocos problemas para detectar esto. Pero si bien varias técnicas avanzadas de aprendizaje automático han ayudado a las computadoras a detectar otras formas de humor, el sarcasmo todavía las elude en gran medida.

Estas otras formas de humor se pueden detectar buscando, por ejemplo, verbos positivos asociados con una situación negativa o indeseable. Y algunos investigadores han usado este enfoque para buscar sarcasmo.





chat en vivo del servicio al cliente de ray-ban

Pero el sarcasmo a menudo está desprovisto de sentimiento. La frase anterior es un buen ejemplo: no contiene palabras que transmitan sentimientos. Por lo tanto, claramente se necesita una nueva estrategia si las computadoras alguna vez detectan este tipo de broma.

Hoy, Aditya Joshi en el Instituto Indio de Tecnología de Bombay en India, y algunos amigos, dicen que se les ocurrió tal estrategia. Dicen que su nuevo enfoque mejora drásticamente la capacidad de las computadoras para detectar el sarcasmo.

Su método es relativamente sencillo. En lugar de analizar el sentimiento en una oración, Joshi y compañía analizan la similitud de las palabras. Lo hacen estudiando la forma en que las palabras se relacionan entre sí en una vasta base de datos de noticias de Google que contiene unos tres millones de palabras. Esto se conoce como la base de datos Word2Vec.



Esta base de datos se ha analizado exhaustivamente para determinar con qué frecuencia las palabras aparecen una al lado de la otra. Esto les permite ser representados como vectores en un espacio de alta dimensión. Resulta que palabras similares se pueden representar mediante vectores similares y que las matemáticas del espacio vectorial pueden capturar relaciones simples entre ellas. Por ejemplo, rey – hombre + mujer = reina.

Aunque existen claras diferencias entre las palabras hombre y mujer, ocupan partes similares del espacio vectorial. Sin embargo, las palabras bicicleta y pez ocupan partes completamente diferentes del espacio y, por lo tanto, se consideran muy diferentes.

quien creó el primer meme

Según Joshi y compañía, es más probable que las oraciones que contrastan conceptos similares con conceptos diferentes sean sarcásticas.

Para probar esta idea, estudian la similitud entre palabras en una base de datos de citas en el sitio web Goodreads. El equipo eligió solo citas que los lectores han etiquetado como sarcásticas y, como control, también incluye citas etiquetadas como filosofía. Esto da como resultado una base de datos de 3.629 citas, de las cuales 759 son sarcásticas. Luego, el equipo comparó los vectores de palabras en cada cita en busca de similitudes y diferencias.



Los resultados hacen una lectura interesante. Joshi y compañía dicen que este enfoque de incrustación de palabras es significativamente mejor que otras técnicas para detectar el sarcasmo. Observamos una mejora en la detección del sarcasmo, dicen.

El nuevo enfoque no es perfecto, por supuesto. Y los errores que comete son instructivos. Por ejemplo, no detectó el sarcasmo en la siguiente cita: Genial. Consejos sobre relaciones de uno de los más buscados de Estados Unidos.

Probablemente se deba a que muchas de estas palabras tienen múltiples significados que la incrustación de Word2Vec no captura.

Otra frase sarcástica que no detecta es: Ah, y supongo que la manzana se comió el queso. En este caso, manzana y queso tienen una puntuación de similitud alta y ninguno de los pares de palabras muestra una diferencia significativa. Entonces, este ejemplo no sigue la regla que el algoritmo está diseñado para buscar.

El algoritmo también identifica incorrectamente algunas oraciones como sarcásticas. Joshi y compañía señalan este, por ejemplo: Oh, mi amor, me gusta desvanecerme en ti como una onda se desvanece en un océano, lenta, silenciosa e interminablemente.

fotos de la cara oculta de la luna

Los humanos no habían etiquetado esto como sarcástico. Sin embargo, no es difícil imaginar que esta oración se use con sarcasmo.

En general, este es un trabajo interesante que plantea algunas direcciones para futuras investigaciones. En particular, sería fascinante usar este tipo de algoritmo para crear oraciones sarcásticas y quizás usar jueces humanos para decidir si funcionan o no en este sentido.

Más allá de eso está la tarea del propio humor computacional. Ese es un objetivo ambicioso, pero quizás uno que no está del todo fuera de alcance. Gran parte del humor es una fórmula, por lo que un algoritmo debería poder aplicar dicha fórmula con facilidad. ¡Sí claro!

Ref: arxiv.org/abs/1610.00883 : ¿Son útiles las características basadas en incrustación de palabras para la detección de sarcasmo?

esconder

Tecnologías Reales

Categoría

Sin Categorizar

Tecnología

Biotecnología

Política De Tecnología

Cambio Climático

Humanos Y Tecnología

Silicon Valley

Informática

Revista Mit News

Inteligencia Artificial

Espacio

Ciudades Inteligentes

Blockchain

Artículo De Fondo

Perfil De Exalumnos

Conexión De Exalumnos

Característica De Noticias Del Mit

1865

Mi Vista

77 Mass Ave

Conoce Al Autor

Perfiles De Generosidad

Visto En El Campus

Cartas De Exalumnos

Función De Noticias Del Mit

Cadena De Bloques

Perfil De Ex Alumnos

77 Avenida De Masas

Política Tecnológica

Perfiles En Generosidad

Noticias

Revista De Noticias Del Mit

Elecciones 2020

Con Índice

Bajo La Cúpula

Manguera

Historias Infinitas

Proyecto De Tecnología Pandémica

Del Presidente

Artículo De Portada

Galería De Fotos

Recomendado