Esta IA sabelotodo aprende leyendo toda la web sin parar

ilustración de gráfico de conocimiento

Sra. tecnología



En julio, OpenAI's último modelo de idioma, GPT-3 , deslumbró con su capacidad para producir párrafos que parecen haber sido escritos por un ser humano. La gente comenzó a mostrar cómo GPT-3 también podía autocompletar código o completar espacios en blanco en hojas de cálculo.

En un ejemplo, el empleado de Twitter Paul Katsen tuiteó la función de hoja de cálculo para gobernarlos a todos, en la que GPT-3 rellena columnas por sí mismo, obteniendo datos de los estados de EE. UU.: la población de Michigan es de 10,3 millones, Alaska se convirtió en estado en 1906, y así sucesivamente.





Excepto que GPT-3 puede ser un poco tonto. La población de Michigan nunca ha sido de 10,3 millones, y Alaska se convirtió en estado en 1959.

Los modelos de lenguaje como GPT-3 son increíbles imitadores , pero tienen poco sentido de lo que realmente están diciendo. Son realmente buenos para generar historias sobre unicornios, dice Mike Tung, director ejecutivo de la startup Diffbot de Stanford. Pero no están entrenados para ser objetivos.

Este es un problema si queremos que las IA sean confiables. Es por eso que Diffbot adopta un enfoque diferente. Está construyendo una IA que lee cada página en toda la web pública, en varios idiomas, y extrae tantos datos como puede de esas páginas.



Al igual que GPT-3, el sistema de Diffbot aprende aspirando grandes cantidades de texto escrito por humanos que se encuentra en línea. Pero en lugar de usar esos datos para entrenar un modelo de lenguaje, Diffbot convierte lo que lee en una serie de factoides de tres partes que relacionan una cosa con otra: sujeto, verbo, objeto.

Al señalar mi biografía, por ejemplo, Diffbot se entera de que Will Douglas Heaven es periodista; Will Douglas Heaven trabaja en MIT Technology Review; MIT Technology Review es una empresa de medios; y así. Cada uno de estos factoides se une a miles de millones de otros en una red de hechos interconectados y en expansión. Esto se conoce como gráfico de conocimiento.

Los gráficos de conocimiento no son nuevos. Han existido durante décadas y fueron un concepto fundamental en las primeras investigaciones de IA. Pero la construcción y el mantenimiento de gráficos de conocimiento generalmente se ha hecho a mano, lo cual es difícil. Esto también impidió que Tim Berners-Lee se diera cuenta de lo que llamó la web semántica, que habría incluido información tanto para máquinas como para humanos, de modo que los bots pudieran reservar nuestros vuelos, hacer nuestras compras o dar respuestas más inteligentes a las preguntas que los motores de búsqueda.

Hace unos años, Google también comenzó a usar gráficos de conocimiento. Busque Katy Perry y obtendrá un cuadro junto a los principales resultados de búsqueda que le indicarán que Katy Perry es una cantautora estadounidense con música disponible en YouTube, Spotify y Deezer. Puede ver de un vistazo que está casada con Orlando Bloom, tiene 35 años y un valor de $ 125 millones, y así sucesivamente. En lugar de brindarle una lista de enlaces a páginas sobre Katy Perry, Google le brinda un conjunto de datos sobre ella extraídos de su gráfico de conocimiento.



Pero Google solo hace esto para sus términos de búsqueda más populares. Diffbot quiere hacerlo para todo. Al automatizar por completo el proceso de construcción, Diffbot ha podido construir lo que podría ser el gráfico de conocimiento más grande de la historia.

Junto con Google y Microsoft, es una de las tres únicas empresas estadounidenses que rastrean toda la web pública. Definitivamente tiene sentido rastrear la web, dice Victoria Lin, científica investigadora de Salesforce que trabaja en el procesamiento del lenguaje natural y la representación del conocimiento. De lo contrario, se puede dedicar mucho esfuerzo humano a crear una gran base de conocimientos. Heiko Paulheim de la Universidad de Mannheim en Alemania está de acuerdo: la automatización es la única forma de construir gráficos de conocimiento a gran escala.

Súper surfista

Para recopilar sus datos, la IA de Diffbot lee la web como lo haría un humano, pero mucho más rápido. Usando una versión supercargada del navegador Chrome, la IA ve los píxeles sin procesar de una página web y usa algoritmos de reconocimiento de imágenes para categorizar la página como uno de 20 tipos diferentes, que incluyen video, imagen, artículo, evento e hilo de discusión. . A continuación, identifica los elementos clave de la página, como el título, el autor, la descripción del producto o el precio, y utiliza la PNL para extraer datos de cualquier texto.

Cada factoide de tres partes se agrega al gráfico de conocimiento. Diffbot extrae datos de páginas escritas en cualquier idioma, lo que significa que puede responder consultas sobre Katy Perry, por ejemplo, utilizando datos extraídos de artículos en chino o árabe, incluso si no contienen el término Katy Perry.

Navegar por la web como un ser humano le permite a la IA ver los mismos hechos que vemos nosotros. También significa que ha tenido que aprender a navegar por la web como nosotros. La IA debe desplazarse hacia abajo, cambiar entre pestañas y hacer clic para eliminar las ventanas emergentes. La IA tiene que jugar en la web como un videojuego solo para experimentar las páginas, dice Tung.

Diffbot rastrea la web sin parar y reconstruye su gráfico de conocimiento cada cuatro o cinco días. Según Tung, la IA agrega entre 100 y 150 millones de entidades cada mes a medida que aparecen nuevas personas en línea, se crean empresas y se lanzan productos. Utiliza más algoritmos de aprendizaje automático para fusionar hechos nuevos con viejos, creando nuevas conexiones o sobrescribiendo las obsoletas. Diffbot tiene que agregar nuevo hardware a su centro de datos a medida que crece el gráfico de conocimiento.

Los investigadores pueden acceder al gráfico de conocimiento de Diffbot de forma gratuita. Pero Diffbot también tiene alrededor de 400 clientes que pagan. El motor de búsqueda DuckDuckGo lo utiliza para generar sus propios cuadros tipo Google. Snapchat lo usa para extraer lo más destacado de las páginas de noticias. La popular aplicación de planificación de bodas Zola lo usa para ayudar a las personas a hacer listas de bodas, recopilando imágenes y precios. NASDAQ, que proporciona información sobre el mercado de valores, la utiliza para la investigación financiera.

zapatos falsos

Adidas y Nike incluso lo usan para buscar en la web zapatos falsificados. Un motor de búsqueda devolverá una larga lista de sitios que mencionan zapatillas Nike. Pero Diffbot permite que estas empresas busquen sitios que realmente vendan sus zapatos, en lugar de simplemente hablar de ellos.

venta de arte digital nft

Por ahora, estas empresas deben interactuar con Diffbot mediante código. Pero Tung planea agregar una interfaz de lenguaje natural. En última instancia, quiere construir lo que él llama un sistema universal de respuesta a preguntas factoides: una IA que podría responder casi cualquier cosa que le preguntes, con fuentes para respaldar su respuesta.

Tung y Lin están de acuerdo en que este tipo de IA no se puede construir solo con modelos de lenguaje. Pero mejor aún sería combinar las tecnologías, utilizando un modelo de lenguaje como GPT-3 para crear una interfaz similar a la humana para un bot sabelotodo.

Aún así, incluso una IA que tiene los hechos claros no es necesariamente inteligente. No estamos tratando de definir qué es la inteligencia, ni nada por el estilo, dice Tung. Solo estamos tratando de construir algo útil.

esconder

Tecnologías Reales

Categoría

Sin Categorizar

Tecnología

Biotecnología

Política De Tecnología

Cambio Climático

Humanos Y Tecnología

Silicon Valley

Informática

Revista Mit News

Inteligencia Artificial

Espacio

Ciudades Inteligentes

Blockchain

Artículo De Fondo

Perfil De Exalumnos

Conexión De Exalumnos

Característica De Noticias Del Mit

1865

Mi Vista

77 Mass Ave

Conoce Al Autor

Perfiles De Generosidad

Visto En El Campus

Cartas De Exalumnos

Función De Noticias Del Mit

Cadena De Bloques

Perfil De Ex Alumnos

77 Avenida De Masas

Política Tecnológica

Perfiles En Generosidad

Noticias

Revista De Noticias Del Mit

Elecciones 2020

Con Índice

Bajo La Cúpula

Manguera

Historias Infinitas

Proyecto De Tecnología Pandémica

Del Presidente

Artículo De Portada

Galería De Fotos

Recomendado