São os dados, estúpido
Não só os programas, mas também os dados que usamos para alimentá-los, determinam muitos aspectos da nossa vida coletiva
Alisson Sellaro
sellaro@sellaro.co
Lixo entra, lixo sai é um ditado antigo que conta com todas as características de uma fagulha de genialidade: é simples, expressa bem uma ideia e se aplica em vários contextos. O termo surgiu em 1864, num livro do matemático inglês Charles Babbage, considerado um dos pais da computação. Continuando a caminhada para explicar tecnologia de forma simples, te convido a olhar para o ditado de Babbage e entender como ele nos impacta.
Imagine que você é mais um dos atingidos pelas taxas recordes de desemprego no Brasil. Na procura por seu novo trabalho, você é convidado a participar de um processo seletivo para uma vaga de recepcionista de hospital. Tudo tranquilo, não fosse um detalhe: você nunca trabalhou no ramo antes, não sabe absolutamente nada sobre saúde, medicina, biologia ou triagem hospitalar.
Por sorte, o hospital que está pleiteando a sua contratação tem um programa de treinamento que é relativamente fácil. A equipe de recrutamento começa explicando que, por conta da pandemia de Covid-19, a recepção se tornou a “linha de frente da linha de frente”. Antes mesmo das equipes de saúde cuidarem dos enfermos, é a heroína ou o herói da recepção a peça fundamental para decidir se o paciente precisa ou não de cuidados médicos. Para aprender o metiér, você irá sentar do lado de uma equipe de especialistas em recepção e triagem em hospitais. São profissionais sérios e experientes, em média com trinta anos de serviço prestados, explica a recrutadora. Você assistirá como estes experts irão decidir o destino de, digamos, novecentas pessoas. Durante o processo decisório, é possível perguntar aos especialistas o que eles consideram em cada paciente para concluir por sua admissão ou dispensa. Finalmente, você é informado que, após ver como estas novecentas pessoas serão encaminhadas, haverá uma espécie de prova. Um computador irá mostrar para você cem pessoas diferentes buscando atendimento e você escolherá se a pessoa deve ou não ser admitida. A recrutadora esclarece que todos os cem casos são baseados em pessoas reais que buscaram atendimento no passado e foram recepcionadas pela equipe de especialistas. O hospital sabe, portanto, qual foi a decisão tomada para cada uma delas. Ganha a vaga de emprego a candidata ou o candidato que conseguir o resultado na prova mais próximo dos casos reais.
O que você leu até aqui é uma descrição simplificada do que é um sistema de inteligência artificial: um programa que nasce sem informação (conhecimento), e é treinado com muitos dados para tomar decisões ou prever resultados. Quando treinamos o sistema fornecendo os dados iniciais, estamos ensinando como ele deve reagir a certas situações. Após treinado, o sistema passa por uma verificação para confirmar se as decisões indicadas coincidem com a decisão real. Se o comportamento do sistema for similar, na maioria das vezes, ao resultado esperado, o programa está pronto para “tomar decisões sozinho” para novos casos.
Simples, não? Esta categoria de sistemas é também conhecida por algoritmos ou modelos. Sabendo ou não, você usa estas tecnologias o tempo todo. Por exemplo: quando você procura algo na Internet, os resultados que você vê foram cuidadosamente escolhidos. O sistema de busca considerou a sua localização, a língua que você utilizou, os assuntos que te interessam, etc. Tudo isso com o propósito de te mostrar o que o motor de busca considera (decide) ser mais relevante para você. A ordem em que estes resultados são exibidos é também decidida pelo algoritmo. Afinal de contas, ninguém quer ser obrigado a navegar por vinte páginas de busca antes de chegar no resultado que realmente interessa, certo?
Outro exemplo interessante e comum é o quando você faz uma compra com o seu cartão de crédito. No intervalo de tempo entre o vendedor passar o cartão na máquina e você digitar sua senha, a operadora do cartão decide se a compra deve ser aprovada ou não. Nestes poucos segundos, o sistema verifica se você tem limite, se aquele local de compra é compatível com sua localização, se o horário da compra e o valor da transação não levantam alguma suspeita de fraude, etc.
De volta ao treinamento do processo seletivo que você está participando, sua atenção é total. Suas reservas financeiras estão acabando e você precisa ganhar a vaga. Falando com os especialistas em triagem hospitalar, você aprende que eles fazem muitas perguntas aos pacientes, mas que consideram apenas três fatores: ocorrência de febre nos últimos dias, se eles estão se queixando de falta de ar e se eles são brancos. Qualquer paciente que não atenda uma ou mais destas três condições é dispensado. Nenhum outro parâmetro é relevante para a decisão de admitir ou negar atendimento.
Na hora da prova, você deve decidir sobre uma paciente que está com febre alta, visivelmente com falta de ar e é negra. Qual a sua decisão neste caso? Se você realmente precisar do emprego e seguir as instruções à risca, você provavelmente “aprendeu” o que fazer. A cor da pele seria suficiente para dispensar a paciente. Isso faz algum sentido? Se serve de consolo, você pode sempre por a culpa no sistema.
O fato é que, na inteligência artificial, a inteligência depende diretamente da qualidade dos dados escolhidos para o treinamento dos modelos. Informações incorretas, parciais ou distorcidas geram resultados muito diferentes do esperado, correto ou justo. A burrice artificial é, portanto, perfeitamente possível: basta que os dados fornecidos para treinar os sistemas – ou os ditos “especialistas” – sejam duvidosos. Por esta razão, nem sempre é simples determinar a confiabilidade dos resultados produzidos por estes sistemas. Embora as consequências provocadas possam ser enormes. É preciso que todos tenhamos um conhecimento mínimo sobre estas questões para que possamos discutir, enquanto sociedade, que categoria de proteções precisamos nos sistemas de inteligência artificial.
É bom lembrar: lixo entra, lixo sai. Vale para tecnologia e, como vemos diariamente no noticiário político, vale também para a vida. Babbage era mesmo um gênio.