Nós conversamos o tempo todo sobre computadores nos entenderem. Dizemos que o Google "sabia" o que estávamos procurando, ou que a Cortana "entendia" o que estávamos dizendo, mas "entender" é um conceito muito difícil. Especialmente quando se trata de computadores.
Um campo de linguística computacional, chamado processamento de linguagem natural (PNL), está trabalhando nesse problema particularmente difícil. É um campo fascinante agora, e uma vez que você tenha uma ideia de como isso funciona, você começará a ver seus efeitos em todos os lugares.
Uma nota rápida: este artigo tem alguns exemplos de um computador que responde à fala, como quando você pergunta algo à Siri. A transformação da fala audível em um formato compreensível por computador é chamada de reconhecimento de fala. A PNL não está preocupada com isso (pelo menos na capacidade que estamos discutindo aqui). A PNL só entra em jogo quando o texto está pronto. Ambos os processos são necessários para muitas aplicações, mas são dois problemas muito diferentes.
Definindo Compreensão
Antes de entrarmos em como os computadores lidam com a linguagem natural, precisamos definir algumas coisas.
Primeiro de tudo, precisamos definir a linguagem natural. É fácil: toda linguagem usada regularmente por pessoas se enquadra nessa categoria. Não inclui coisas como linguagens construídas (Klingon, Esperanto) ou linguagens de programação de computadores. Você usa linguagem natural quando fala com seus amigos. Você provavelmente também usa para conversar com seu assistente pessoal digital.
Então, o que queremos dizer quando dizemos entender? Bem, é complexo. O que significa entender uma sentença? Talvez você diga que isso significa que agora você tem o conteúdo pretendido da mensagem em seu cérebro. Entender um conceito pode significar que você pode aplicar esse conceito a outros pensamentos.
Definições de dicionário são nebulosas. Não há resposta intuitiva. Os filósofos têm discutido sobre coisas assim há séculos.
Para os nossos propósitos, vamos dizer que a compreensão é a capacidade de extrair com precisão o significado da linguagem natural . Para um computador entender, ele precisa processar com precisão um fluxo de entrada de fala, converter esse fluxo em unidades de significado e poder responder à entrada com algo útil.
Obviamente, isso tudo é muito vago. Mas é o melhor que podemos fazer com espaço limitado (e sem um grau de neurofilosofia). Se um computador pode oferecer uma resposta semelhante a humana, ou pelo menos útil, a um fluxo de entrada de linguagem natural, podemos dizer que ele entende. Esta é a definição que usaremos daqui para frente.
Um problema complexo
Linguagem natural é muito difícil para um computador lidar. Você pode dizer: "Siri, me dê instruções para Punch Pizza", enquanto eu poderia dizer: "Siri, Punch Pizza, por favor."
Em seu comunicado, a Siri pode escolher a frase-chave “dê-me instruções” e, em seguida, executar um comando relacionado ao termo de busca “Punch Pizza”. No entanto, a Siri precisa escolher “rota” como palavra-chave e saber que Punch Pizza ”é onde eu quero ir, não“ por favor ”. E isso é apenas um exemplo simplista.
Pense em uma inteligência artificial que lê e-mails e decide se eles podem ou não ser golpes. Ou um que monitora os posts de mídia social para avaliar o interesse em uma determinada empresa. Certa vez, trabalhei em um projeto onde tínhamos que ensinar um computador a ler anotações médicas (que têm todos os tipos de convenções estranhas) e coletar informações delas.
Isso significa que o sistema tinha que ser capaz de lidar com abreviações, sintaxe estranha, erros ortográficos ocasionais e uma grande variedade de outras diferenças nas notas. É uma tarefa altamente complexa que pode ser difícil mesmo para humanos experientes, muito menos máquinas.
Definindo um exemplo
Neste projeto em particular, eu fazia parte da equipe que estava ensinando o computador a reconhecer palavras específicas e as relações entre as palavras. O primeiro passo do processo foi mostrar ao computador as informações que cada nota continha, então anotamos as anotações.
Havia um grande número de diferentes categorias de entidades e relações. Pegue a frase “Ms. A dor de cabeça de Green foi tratada com ibuprofeno ”, por exemplo. A Sra. Green foi marcada como PESSOA, a dor de cabeça foi marcada como SINAL OU SINTOMA, o ibuprofeno foi marcado como MEDICAÇÃO. Então, Ms. Green estava ligada à dor de cabeça com uma relação PRESENTS. Finalmente, o ibuprofeno estava ligado à dor de cabeça com uma relação TREATS.
Marcamos milhares de notas dessa maneira. Nós codificamos diagnósticos, tratamentos, sintomas, causas subjacentes, co-morbidades, dosagens e tudo o mais que você poderia imaginar relacionado à medicina. Outras equipes de anotação codificavam outras informações, como sintaxe. No final, tivemos um corpus cheio de anotações médicas que a IA poderia “ler”.
A leitura é tão difícil de definir quanto a compreensão. O computador pode facilmente ver que o ibuprofeno trata uma dor de cabeça, mas quando ele aprende essa informação, ela é convertida em zeros e sem sentido (para nós). Pode certamente devolver informações que pareçam humanas e úteis, mas que constituem entendimento O que a Inteligência Artificial não é O que a Inteligência Artificial Não É? Os robôs inteligentes, sencientes, vão dominar o mundo? Não hoje - e talvez nunca. Consulte Mais informação ? Mais uma vez, é em grande parte uma questão filosófica.
O verdadeiro aprendizado
Neste ponto, o computador passou pelas notas e aplicou vários algoritmos de aprendizado de máquina. 4 Algoritmos de aprendizado de máquina que moldam sua vida 4 Algoritmos de aprendizado de máquina que moldam sua vida Você pode não perceber, mas aprendizado de máquina já está ao seu redor, e pode exercer um surpreendente grau de influência sobre sua vida. Não acredita em mim? Você pode se surpreender. Consulte Mais informação . Os programadores desenvolveram rotinas diferentes para identificar partes da fala, analisar dependências e grupos de interesse e rotular papéis semânticos. Em essência, a IA estava aprendendo a “ler” as anotações.
Os pesquisadores poderiam, eventualmente, testá-lo, dando-lhe uma nota médica e pedindo-lhe para rotular cada entidade e relação. Quando o computador reproduzia com precisão as anotações humanas, você poderia dizer que aprendeu a ler as referidas anotações médicas.
Depois disso, era apenas uma questão de reunir uma enorme quantidade de estatísticas sobre o que havia lido: quais medicamentos são usados para tratar quais distúrbios, quais tratamentos são mais eficazes, as causas subjacentes de conjuntos específicos de sintomas, e assim por diante. No final do processo, o AI seria capaz de responder a questões médicas com base em evidências de notas médicas reais. Não precisa depender de livros didáticos, empresas farmacêuticas ou intuição.
Aprendizagem Profunda
Vamos ver outro exemplo. A rede neural DeepMind do Google está aprendendo a ler artigos de notícias. Como a IA biomédica acima, os pesquisadores queriam extrair informações relevantes e úteis de textos maiores.
Treinar um AI em informações médicas foi difícil o suficiente, então você pode imaginar quantos dados anotados você precisaria para tornar um AI capaz de ler artigos de notícias em geral. Contratar anotadores suficientes e passar informações suficientes seria proibitivamente caro e demorado.
Então a equipe da DeepMind voltou-se para outra fonte: sites de notícias. Especificamente, CNN e o Daily Mail.
Por que esses sites? Porque eles fornecem resumos de seus artigos que não simplesmente extraem sentenças do próprio artigo. Isso significa que a IA tem algo para aprender. Os pesquisadores basicamente disseram à AI: “Aqui está um artigo e aqui estão as informações mais importantes nele.” Então eles pediram para puxar o mesmo tipo de informação de um artigo sem realces com marcadores.
Esse nível de complexidade pode ser tratado por uma rede neural profunda, que é um tipo especialmente complicado de sistema de aprendizado de máquina. (A equipe da DeepMind está fazendo algumas coisas incríveis neste projeto. Para obter os detalhes, confira esta excelente visão geral da Revisão de Tecnologia do MIT.)
O que um AI de leitura pode fazer?
Agora temos uma compreensão geral de como os computadores aprendem a ler. Você pega uma quantidade enorme de texto, informa ao computador o que é importante e aplica alguns algoritmos de aprendizado de máquina. Mas o que podemos fazer com uma IA que extrai informação do texto?
Já sabemos que você pode extrair informações práticas específicas de anotações médicas e resumir artigos de notícias em geral. Há um programa de código aberto chamado PAN que analisa a poesia, retirando temas e imagens. Pesquisadores freqüentemente usam aprendizado de máquina para analisar grandes corpos de dados de mídia social, que é usado pelas empresas para entender os sentimentos do usuário, ver o que as pessoas estão falando e encontrar padrões úteis para o marketing.
Os pesquisadores usaram o aprendizado de máquina para obter informações sobre comportamentos de e-mail e os efeitos da sobrecarga de e-mail. Os provedores de e-mail podem usá-lo para filtrar o spam da sua caixa de entrada e classificar algumas mensagens como de alta prioridade. Leitura AIs são críticos para fazer chatbots de serviço ao cliente eficazes 8 Bots você deve adicionar ao seu aplicativo de Facebook Messenger 8 Bots você deve adicionar ao seu aplicativo de Facebook Messenger Facebook Messenger abriu para chat bots, permitindo que as empresas oferecem atendimento ao cliente, notícias e mais diretamente para você através do aplicativo. Aqui estão alguns dos melhores disponíveis. Consulte Mais informação . Em qualquer lugar há texto, há um pesquisador trabalhando em processamento de linguagem natural.
E à medida que esse tipo de aprendizado de máquina melhora, as possibilidades só aumentam. Os computadores são melhores que os humanos no xadrez, no Go e nos videogames agora. Logo eles podem ser melhores em ler e aprender. É este o primeiro passo para uma IA forte? Eis porque os cientistas acham que você deveria estar preocupado com a inteligência artificial. Eis porque os cientistas acham que você deveria estar preocupado com a inteligência artificial. Você acha que a inteligência artificial é perigosa? A IA pode representar um sério risco para a raça humana? Estas são algumas das razões pelas quais você pode querer se preocupar. Consulte Mais informação ? Nós vamos ter que esperar e ver, mas pode ser.
Que tipos de usos você vê para ler textos e aprender IA? Que tipo de aprendizado de máquina você acha que veremos no futuro próximo? Compartilhe seus pensamentos nos comentários abaixo!
Créditos da Imagem: Vasilyev Alexandr / Shutterstock