Avaliação de liquidez com modelos explicáveis de machine learning

Poder explicar como os modelos de aprendizado de máquina (machine learning) funcionam tem sido um ponto de controvérsia desde o início desta tecnologia. A Bloomberg pretende lançar mais métricas empíricas no fim deste ano, para reforçar a explicabilidade de seus modelos de liquidez. As métricas estarão inicialmente disponíveis por meio de feeds de dados da Bloomberg e serão apresentadas de forma mais proeminente nas telas de liquidez do Terminal Bloomberg ao decorrer de 2024.

Este é o passo mais recente de um esforço de longa data para fazer com que os clientes confiem nos chamados modelos “caixa preta” em um campo onde esses modelos se beneficiam de uma vantagem convincente em relação aos métodos mais tradicionais. Mas a jornada nem sempre foi fácil.

Agende uma demo.

Para sua própria satisfação, a Bloomberg há muito tempo provou, por meio de backtests, que seus modelos de liquidez com aprendizado de máquina são mais precisos do que outras abordagens mais convencionais. Mesmo assim, no início, a empresa sofreu para convencer os clientes a confiar nos novos modelos da mesma forma.

“No início, eu costumava controlar um pouco minhas palavras para não usar o termo “aprendizado de máquina”, mas, em vez disso, explicava detalhadamente o que o modelo fazia”, afirmou Zane Van Dusen, que é o responsável mundial do negócio de dados de análise de risco e investimento da Bloomberg.

A experiência da Bloomberg também não foi única. No campo do risco de liquidez, outras empresas também – especialmente a BlackRock – arquivaram modelos de aprendizado de máquina no passado, precisamente porque não podiam explicar o funcionamento interno do modelo. Hoje, os reguladores estão pressionando os compradores para acompanhar o risco de liquidez mais de perto. A crise que abalou o Reino Unido em setembro do ano passado e a turbulência nos títulos do Tesouro dos EUA em março de 2020 mostraram o dano que tais episódios podem provocar. As próximas métricas da Bloomberg visam conquistar todos os que duvidam e que ainda não têm certeza se devem confiar nos modelos caixa-preta da Bloomberg.

“Massagem ideal”

O que a Bloomberg chama de sua Solução de Avaliação de Liquidez (LQA) – na verdade, uma coleção de modelos para uma série de classes de ativos – foi lançada em 2016 com o primeiro uso rudimentar de aprendizado de máquina para estimar o risco de liquidez.

O mecanismo da LQA parece simples. Os usuários inserem métricas, tais como o quanto desejam negociar e com que rapidez, e a LQA lhes diz o que isso custará. “O cerne do que a solução LQA faz é que ela permite que você entenda a relação entre volume, custo e tempo para um ativo. Você conecta duas dessas variáveis ao modelo e ele resolve para fornecer a terceira”, explica Van Dusen.

Na solução LQA, o pacote de modelos calcula um perfil de liquidez individual adaptado a um único ativo, aprendendo a ponderar até 150 características que poderiam contribuir para o perfil de liquidez do ativo.

As características são simples, como Van Dusen procura enfatizar. Para os títulos, digamos, elas podem incluir o valor da dívida, maturidade e cupom, o número de negociações no último mês, número de ofertas executáveis, número de formadores de liquidez, preço, volatilidade e o spread de compra/venda. “Nada muito esotérico”, ele afirma. “Não estamos inserindo nenhum dado alternativo ou bizzaro”.

O que a equipe de Van Dusen faz, no entanto, é remodelar os dados em formas nas quais seus modelos de aprendizado de máquina possam fazer um melhor uso. “Como parte do processo de aprendizado de máquina, descobrimos como otimizar a mensuração dos dados para que possamos obter uma maior precisão”. Para os títulos privados, por exemplo, o valor da dívida é convertido em dólares americanos para todos os títulos mundiais, e depois o logaritmo desse valor é calculado para produzir uma característica final que é inserida no modelo.

“O algoritmo de aprendizado de máquina é muito bom em descobrir, dentre essas 150 características iniciais, quais são as 30 a 50 mais importantes, que realmente fazem a diferença em termos de quanto ele custa para ser liquidado”, disse Van Dusen. “Ele tenta descobrir a ponderação ideal de cada uma dessas características”.

A equipe treina o modelo trimestralmente usando dados históricos e o calibra diariamente de acordo com os dados atuais do mercado.

Pessimismo

As primeiras iterações foram recebidas com ceticismo, disse Van Dusen. “De certa forma, chegamos um pouco cedo demais em termos de aprendizado de máquina. Por ser um conceito tão novo no setor, embora tivéssemos desenvolvido algo com ótimos resultados, era uma conversa difícil de ter com os clientes”.

Assim, sua abordagem para ganhar a confiança foi de se concentrar nos dados e nos resultados antes de entrar na metodologia. E o trabalho árduo de passar pelos processos de validação de modelos dos primeiros clientes da Bloomberg ajudou a empresa a entender e explicar melhor seus próprios modelos.

“Tínhamos documentos de metodologia que compartilhávamos com nossos clientes que tinham 25 páginas, mas, ao final do exercício de validação do modelo, acabamos com um documento de 200 páginas”, disse Van Dusen. Agora, os participantes do mercado estão mais familiarizados e confortáveis com o aprendizado de máquina. Mas, mesmo assim, muitos ainda consideram que os modelos são limitados em relação ao quão longe seu “raciocínio” pode ir.

“A explicabilidade envolve expor o maior número de métricas brutas possível”, afirmou Van Dusen. O próximo lançamento de dados empíricos da Bloomberg tem como objetivo mostrar aos clientes onde o resultado é impulsionado por aquilo que o modelo aprendeu e onde é influenciado principalmente por dados observáveis.

A redução de liquidez causada pelo início da pandemia de Covid-19 em março de 2020 comprovou o valor do aprendizado de máquina em modelos de risco de liquidez, segundo Van Dusen. Antes disso, os gestores de ativos pensavam principalmente na repetição da crise financeira mundial. “Até 2020, eu diria que todo o foco do setor era Lehman, Lehman, Lehman – esse era o cenário que todos tentavam simular”. O gargalo dos mercados mais líquidos do mundo mostrou até que ponto a liquidez poderia se tornar um problema em locais inesperados. De uma hora para outra, os gestores de ativos estavam pedindo modelos que pudessem prever como as condições de negociação poderiam mudar em uma gama muito mais ampla de cenários, disse Van Dusen.

De volta para o futuro

As técnicas de modelagem avançaram muito desde 2016, quando o aprendizado de máquina significava pouco mais do que regressões lineares. A Bloomberg fez uso de redes neurais profundas pela primeira vez para modelar os efeitos não lineares da liquidez em 2017, quando lançou seu modelo para os títulos municipais dos EUA. Ela usou uma abordagem semelhante para modelar produtos securitizados em 2018.

Mais recentemente, a empresa atualizou seu modelo original para títulos públicos e privados, passando de um modelo de regressões lineares para um modelo de redes neurais profundas em 2022.

Os backtests, especialmente para períodos repentinos de volatilidade, como o de março de 2020, revelam a vantagem destes modelos dinâmicos mais recentes. As técnicas tradicionais oferecem apenas uma visão sobre a liquidez extrapolada a partir de dados observáveis atuais, disse Van Dusen. Os modelos de aprendizado de máquina são capazes de estimar uma liquidez precisa, mesmo quando esses dados são limitados.

A abordagem de uma classificação mais convencional define categorias amplas, como “títulos privados de grau de investimento dos EUA”, “títulos públicos europeus de alto grau” e “títulos privados de alto rendimento da região Ásia-Pacífico” e, em seguida, assume medidas genéricas de liquidez para cada categoria. Os principais desafios com esta abordagem são que ela não é suficientemente granular, pois a liquidez é específica do instrumento, e não reage às condições de mercado em constante mudança e a eventos específicos de uma empresa. Para a abordagem baseada em regras/cascata, uma empresa trabalharia de cima para baixo, de repositórios de dados mais estreitos para mais amplos para avaliar a liquidez. Ela começaria com negociações recentes para um título específico, e se isso não estivesse disponível, passaria para negociações com títulos do mesmo emissor, e se isso também não estivesse disponível, seria possível tentar no nível de setor e assim por diante. A granularidade também é um problema com esta abordagem. A liquidez muda ao longo do tempo. Novas emissões são frequentemente negociadas em volumes mais altos, enquanto os títulos de longa duração geralmente têm spreads de compra/venda mais amplos. “Além disso, você corre o risco de subestimar a liquidez se considerar apenas as negociações observadas no mercado de renda fixa. É fundamental estimar a diferença entre o volume real e o disponível”, afirmou Van Dusen.

Modelos de aprendizado de máquina são especialmente úteis para entender a relação dinâmica entre as características de liquidez. A técnica é única, disse Van Dusen, para ativos negociados de forma restrita, onde o risco de liquidez é um “problema de poucos dados em um vasto universo”.

“Para classes de ativos como a de títulos municipais e a hipotecas é ainda mais complicada, pois os dados são ainda mais escassos e mais complexos. Foi aí que tivemos que evoluir para coisas como modelos de aprendizado profundo e redes neurais para nos ajudar a obter uma maior precisão”.

Modelos de aprendizado de máquina também se mostraram mais precisos na modelagem dinâmica de eventos extremos – momentos em que as avaliações comuns não são mais válidas. Os mercados estão repletos de anomalias
que podem surgir nesses momentos, disse Van Dusen – ativos de alto rendimento que são negociados diariamente e são mais líquidos do que certos ativos de grau de investimento que são raramente negociados, por exemplo. “Esse é o tipo de coisa que queremos captar. Essa é a real gestão de riscos de liquidez”.

Acima de tudo, o aprendizado de máquina é melhor do que os modelos convencionais na hora de prever o inesperado, argumenta Van Dusen.

Analisando a loucura de março (“March madness”) dos últimos anos – a liquidação em massa do Tesouro dos EUA em 2020, a volatilidade do mercado desencadeada pela invasão da Rússia à Ucrânia em 2022 e a turbulência bancária em 2023: “Estas são as coisas que pegaram o mercado de surpresa. Se você tentar modelar a liquidez com base no que realmente enxerga, acabará subestimando a liquidez em muitos setores”.

Este artigo foi redigido por Celeste Tamers e reproduzido do Risk.net.

Agende uma demo.