Na análise de dados contemporânea, big data e os muitos “Vs” são temas comuns, incluindo variedade, velocidade e volume, e a ampla gama de ferramentas e técnicas que evoluem para lidar com ambientes ricos em dados. No entanto, se os dados forem escassos, difíceis de obter ou incompletos, que tipo de abordagem será mais eficaz? Blanka Horvath, do King’s College London e The Alan Turing Institute, abordou essa questão no seminário BBQ (Bloomberg Quant) para um público online. Em seu trabalho, a simulação de mercado focada em dados e baseada em redes neurais fornece um método flexível para modelar séries temporais financeiras sem fazer suposições sobre a dinâmica estocástica que ocorre em segundo plano. A chamada simulação de mercado generativa é independente do modelo, embora as escolhas específicas influenciem as características dos caminhos na simulação. Se o modelo Black Scholes for usado para treinamento, o processo resultará em estratégias de hedging sob os parâmetros do Black Scholes. Se o modelo de Heston for escolhido, as estratégias se adaptam. Levando esta observação um passo adiante, Horvath pergunta: “E se os dados de treinamento forem semelhantes aos dados do próprio mercado?” Na verdade, explorar esta questão produz resultados realistas que não sofrem pelas deficiências dos modelos de Black Scholes ou Heston.
Como a modelagem generativa funciona?
A modelagem generativa é construída em torno de um tema — o teorema da aproximação universal, que sustenta que se houver nós suficientes na rede, é possível aproximar qualquer função ou distribuição. Então, quer a distribuição seja uniforme ou normal padrão, ela será mapeada para a distribuição de retornos alvo vista nos dados. As formas mais comuns de modelagem generativa são as máquinas de Boltzmann restritas (RBM, na sigla em inglês) e, mais recentemente, as redes generativas adversas (GANS, na sigla em inglês), que apresentam bom desempenho em imagens. No entanto, este recurso é caro e desnecessário ao trabalhar com dados de séries temporais financeiras. Em vez disso, os Autoencoders Variacionais (VAEs, na sigla em inglês) são os melhores candidatos neste caso, tendo uma vantagem distinta por serem parcimoniosos e capazes de operar em ambientes onde poucos dados estão disponíveis.
Naturalmente, o mercado conta com diversas situações nas quais existe uma grande quantidade de dados, mas há desafios quando este não é o caso ou os dados são privados e não podem ser acessados facilmente. Nestes casos, restrições e gargalos podem ocorrer ao usar dados reais para o mecanismo de hedging. Além disso, ao modelar um processo estocástico por completo, a observação é realizada em um padrão temporal individual, e haverá lacunas onde faltar clareza sobre o que aconteceu entre os marcos temporais. Um modelo generativo fornece flexibilidade em cada ponto de observação, sem fazer suposições sobre o que acontece entre eles. A análise agrupa-se rapidamente, mesmo com um pequeno conjunto de dados.
Para avaliar o desempenho, Horvath executou um modelo generativo baseado em retornos e um modelo generativo baseado em caminhos, e calculou os retornos diários, semanais e mensais. Ao definir uma configuração baseada em retornos, elementos de duas distribuições são explorados e, se um teste bilateral for aplicado, suas origens se tornarão evidentes — sejam eles originados das mesmas distribuições ou de distribuições diferentes. Além disso, o teste pode dizer com um determinado nível de confiança se os elementos se originam do mesmo processo estocástico ou de processos diferentes, embora ainda seja robusto com relação a dados ausentes ou dados irregulares de amostra. Horvath descobriu que o desempenho era satisfatório em termos de deep hedging; um possível caso de uso é a negociação de alta frequência, na qual as observações podem variar amplamente de um dia para o outro. Pesquisas futuras abordarão caminhos de mercado, envolvendo trabalho com VAE condicional e pós-processamento.
Na sessão de perguntas e respostas, o anfitrião do evento, Bruno Dupire, questionou sobre os conceitos de assinaturas, de decomposição e de comparação de resultados em diferentes mercados. Horvath sugeriu o trabalho de Terry Lyons sobre computação determinística com rough path – teoria da década de 90 que propõe uma abordagem para equações diferenciais e integrais ao longo de caminhos irregulares. Claramente, o mercado está em constante movimento, de forma que tanto o ruído quanto os eventos extremos dificultam a interpretação. No entanto, a modelagem generativa pode capturar caudas longas (fat tails) — no momento em que projetarmos a partir do caminho do mercado, as caudas estarão lá, afirma.
Lightning talks
Após a curta sessão de Q&A, Bruno Dupire deu início a uma série de apresentações de 5 minutos, as chamadas “lightning talks”, nas quais especialistas do setor, pesquisadores e acadêmicos apresentam uma ampla variedade de assuntos, a fim de estimular novas ideias e interações entre várias disciplinas. Cada apresentação examina a maneira como o setor está evoluindo e serve como um aspecto exploratório essencial da série de seminários Bloomberg Quant.
Nesta sessão, Dhruv Madeka, da Amazon, descreveu a previsão de múltiplos horizontes com base na atenção; Michael Ang, da Bloomberg L.P., forneceu uma visão geral de amostragem de Monte Carlo via Cadeia de Markov (Markov chain Monte Carlo — MCMC); e Anna Bogolubova, da Juilliard School e BOMAA, revelou a presença de criptogramas na música de Bach.
Ainda, Julien Guyon, da Bloomberg L.P., apresentou um contra-exemplo de correlação local em termos de um modelo de volatilidade estocástica simples. Arka Bandoyopadhyay, da City University of New York e da Zicklin School of Business do Baruch College, explicou como a Lei CARES está desalinhada no que diz respeito à tolerância, trazendo achados sobre comportamento oportunista e estratégico. Por fim, Antoine Savine, do Danske Bank, abordou machine learning diferencial, com foco no desenvolvimento de um mecanismo de precificação rápido e como este funciona em um ambiente de produção.
Sobre a série de seminários Bloomberg Quant
A série de seminários Bloomberg Quant (BBQ) ocorre todo mês e abrange uma ampla gama de tópicos em finanças quantitativas. O seminário BBQ é oferecido em formato virtual e programado para acomodar participantes de toda a EMEA e das Américas. As sessões são presididas por Bruno Dupire, chefe de Pesquisa Quantitativa da Bloomberg L.P., e traz um(a) orador(a) principal apresentando sua pesquisa atual. Esta apresentação é seguida por diversas “lightning talks”, de cinco minutos cada, em rápida sucessão. Este formato oferece ao público a oportunidade de imersão em uma variedade maior de tópicos.
Inscreva-se para receber convites para eventos futuros nesta série.