Uma das limitações dos sistemas de inteligência artificial é que as informações usadas para treiná-los ficaram congeladas no tempo. Se você perguntar ao famoso chatbot da OpenAI, o ChatGPT, se as vacinas contra a Covid funcionam contra a variante mais comum que circula em 2023, ele responde: “Como um modelo de linguagem de IA, não tenho acesso a dados ou informações em tempo real além da minha última atualização em setembro de 2021.”
Muita coisa mudou desde essa data – há novas cepas da doença, novas aprovações de vacinas e medicamentos e dezenas de milhares de novos estudos científicos. Para que os chatbots sejam úteis no mundo da medicina, eles precisam ter acesso às pesquisas mais recentes.
Com investimento de US$ 32 milhões (R$ 151 milhões), quase uma dúzia de funcionários com doutorados (ou candidatos a um) e um supercomputador no deserto de Nevada, Daniel Nadler tem trabalhado para resolver esse problema com sua nova startup OpenEvidence.
O treinamento constante de modelos de aprendizado de máquina requer um grande (e muito caro) poder de computação, mas há outra opção. É um desafio técnico e de engenharia que, segundo o fundador, envolve combinar esses modelos de linguagem com uma infinidade de documentos clínicos em tempo real.
Nadler, 40 anos, basicamente fornece à IA acesso a um novo conjunto de dados antes de responder à pergunta feita pelo usuário – um processo que os cientistas da computação chamam de “geração aumentada de recuperação”.
Se você perguntar ao chatbot da OpenEvidence sobre a questão das vacinas e a nova variante da Covid, ele responde que “estudos específicos sobre essa variante são limitados” e inclui informações de pesquisas publicadas em fevereiro e maio de 2023 com citações. A principal diferença, diz Nadler, é que seu modelo “pode responder com um livro aberto, ao contrário de um livro fechado”.
Do mercado financeiro à saúde
Essa não é a primeira experiência de Nadler como fundador de uma startup de IA. Ele vendeu sua empresa anterior, a Kensho Technologies, para a companhia de análises e pesquisa de mercado financeiro S&P Global por US$ 550 milhões (R$ 2,5 bilhoes) – mais US$ 150 milhões (R$ 708 milhões) em ações – em 2018. A Kensho é uma ferramenta baseada em IA para traders de Wall Street que analisa milhões de dados de mercado para ajudar a identificar oportunidades de arbitragem – compra e venda de determinado ativo.
Durante a pandemia, quando o número de estudos científicos sobre a Covid-19 aumentou de zero para dezenas de milhares em poucos meses, Nadler percebeu que os profissionais de saúde enfrentavam um problema semelhante ao dos traders: como separar informações confiáveis e importantes do barulho?
Ele logo descobriu que isso não valia apenas para os estudos da Covid, mas para o campo médico de forma mais ampla, já que são publicados cerca de dois artigos científicos por minuto. “A base do problema era idêntica”, diz Nadler. “Uma sobrecarga de informações e a necessidade de triagem dessas informações e de usar computadores para fazer isso.”
Potencial de negócios de inteligência artificial e saúde
Investidores de capital de risco aportaram mais de US$ 46 bilhões (R$ 217 bilhões) em startups de inteligência artificial e aprendizado de máquina com foco em saúde nos EUA na última década, de acordo com dados da empresa de finanças PitchBook. O investimento atingiu um pico de US$ 13,4 bilhões (R$ 63 bilhões) em 2021 e caiu para US$ 10,3 bilhões (R$ 48,6 bilhões) em 2022. As startups levantaram US$ 3 bilhões (R$ 14 bilhões) em 205 negócios até agora este ano.
Nadler fundou a OpenEvidence em novembro de 2021. Depois de investir US$ 5 milhões (R$ 23,6 milhões) de seu próprio dinheiro, ele diz que fechou uma rodada de financiamento da Série B de US$ 27 milhões (R$ 127 milhões) em julho de 2022, avaliando a startup em US$ 425 milhões (R$ 2 bilhões). Ele abriu a rodada para ex-investidores da Kensho, incluindo o bilionário capitalista de risco Jim Breyer, o bilionário cofundador da Vista Equity Partners, Brian Sheth, e o banqueiro de investimentos Ken Moelis, entre outros. Em março, a OpenEvidence foi selecionada para ser acelerada pela Mayo Clinic Platform. Desde então, Nadler diz que mais de 10 mil médicos se inscreveram para acesso antecipado.
A OpenEvidence está tentando assumir o grande banco de dados usado por dois milhões de profissionais de saúde em todo o mundo, chamado UpToDate, da empresa de dados global com sede na Holanda, Wolters Kluwer.
Para Nadler, seu negócio, que usa a inteligência artificial, tem uma vantagem em relação a plataformas que são editadas por humanos, como o UpToDate. A OpenEvidence é interativa em vez de uma página estática de texto, o que significa que os usuários podem adaptar suas perguntas a cenários específicos de pacientes e fazer acompanhamentos, em vez de ter que ler grandes textos. Ele também pode digitalizar dezenas de milhares de periódicos em comparação com centenas.
A OpenEvidence está recolhendo informações de mais de 35 milhões de artigos científicos. Nadler diz que vasculha a Biblioteca Nacional de Medicina dos EUA, que tem mais de 31 mil periódicos revisados por pares, várias vezes ao dia. Segundo ele, há cerca de 24 horas de atraso para processar os novos artigos de periódicos e colocá-los no sistema.
Limitações
Uri Alon, pesquisador de pós-doutorado no Language Technologies Institute da Carnegie Mellon University, que não é afiliado à OpenEvidence, diz que é preciso ter cuidado, porque nada é 100% seguro. Segundo ele, esses modelos sempre poderão errar, assim como os humanos. “Se você desse a um humano um monte de documentos ou parágrafos, deixasse ele ler e depois fizesse perguntas e pedisse para dizer de onde veio a resposta nos documentos, até os humanos cometeriam erros.”
Até agora, o uso da OpenEvidence é gratuito para os primeiros usuários, profissionais médicos licenciados. Antonio Forte, professor de cirurgia plástica na Mayo Clinic, e membro do conselho consultivo médico da OpenEvidence, diz que a maior diferença ao usar a OpenEvidence nas últimas semanas foi a economia de tempo. Em vez de ter que ler o equivalente a um capítulo de livro, ele pode obter uma resposta “em 30 segundos, não em 10 minutos”.
Nadler diz que ainda não se decidiu sobre um modelo de receita para a sua empresa. Ele está entre os modelos de assinatura e anúncios, mas está inclinado para uma mistura dos dois. De uma coisa ele tem certeza: a OpenEvidence não se tornará um chatbot para o paciente comum. “Existe um limite muito claro para qualquer dano que possa advir do uso da tecnologia para um paciente, porque vai estar sempre sendo intermediado por um profissional.”
Fonte: Katie Jennings