Este artigo foi escrito por Gerard Francis, diretor de dados corporativos da Bloomberg.
O setor financeiro está vivenciando uma revolução tecnológica em uma escala sem precedentes. O acesso aos dados é o alicerce para esta transformação acelerada. O volume, a complexidade e diversidade dos dados disponíveis para tomadores de decisão cresceram exponencialmente nos últimos anos – mas também se tornaram mais desconexos. Segundo a IBM, 90% dos dados no mundo de hoje foram criados somente nos últimos dois anos.
Três fatores – dados (e dados alternativos), machine learning e processamento de linguagem natural – estão convergindo para transformar fundamentalmente a forma como investidores nos mercados globais de capitais obtêm, consomem e analisam as informações disponíveis. Por sua vez, isso está remodelando estratégias de negociação de empresas de investimento e a abordagem na diferenciação da inteligência de negócios.
O desafio dos dados – mais diversificados, porém mais desconexos
Os conjuntos de dados à disposição das instituições financeiras é vasto e fragmentado. Inclui não apenas os dados fundamentalistas clássicos mais populares (resultados financeiros, preços de títulos), mas dados gerados por processos de negócios (como transações comerciais), dados gerados por máquinas (como informações de satélite) e dados provenientes de fontes menos tradicionais, como mídias sociais.
Os investidores também estão recorrendo aos últimos conjuntos de dados alternativos com novas técnicas focadas na busca de sinais de investimento novos e relevantes, a fim de capturar o índice alfa. O investidor moderno pode assimilar não só preços de títulos e desempenho financeiro, mas também imagens de satélite, informações da cadeia de suprimentos, fatores ambientais, socials e de governança (ESG – environmental, social and governance) e até mesmo tweets.
Embora dados alternativos possam acrescentar embasamento a uma decisão de investimento, o histórico e identificadores comuns são um contexto essencial na tradução destes dados em informação relevante para carteiras de negociação e portfólios.
O setor financeiro gera grandes quantidades de dados. A Bloomberg recebe 100 bilhões de mensagens de dados de mercado por dia e absorve 2 milhões de novas notícias por dia, de 125 mil fontes de notícias. Nossas ferramentas analíticas preditivas baseadas em algoritmos de machine learning e processamento de linguagem natural examinam essas mensagens para encontrar e distribuir as informações mais relevantes aos investidores.
O maior desafio para participantes do mercado e instituições financeiras atualmente é identificar quais conjuntos de dados utilizar; como garantir que os conjuntos de dados sejam de alta qualidade, consistentes, vinculados e prontos para uso; e como entender esses dados rapidamente para fundamentar decisões críticas.
Dados prontos para uso que permitem automação
A explosão nos dados é apenas o propulsor básico de mudança e complexidade. Considerando-se o tamanho da tarefa em questão, não é surpresa que instituições financeiras estejam buscando tecnologias para automatizar processos, que auxiliem a melhor gerenciar os dados e gerar alfa.
Algoritmos de machine learning emergiram rapidamente na vanguarda dessas tecnologias. Os avanços no processamento de linguagem natural e na coleta de dados estão impulsionando a automação de negociações nas plataformas de execução eletrônica. As empresas estão explorando big data e machine learning para prever demandas de clientes e oscilações de preços.
No buy-side, gestores de ativos e hedge funds estão usando a análise preditiva para avaliar o risco com base na liquidez de mercado. À medida que mais workflows se tornam automatizados, profissionais financeiros podem se concentrar mais no aspecto cognitivo – incluindo a seleção de estratégias e portfólios, e à formulação de teses de investimento. Profissionais financeiros buscam resolver diversos problemas no setor de finanças por meio desses métodos, pois permitem a criação de inteligência mais sofisticada para workflows de negociação e voltados ao cliente.
No roadshow Bloomberg Machine Learning Decoded em quatro cidades da região Ásia-Pacífico – Sydney, Singapura, Tóquio e Mumbai – descobrimos que a maioria dos profissionais financeiros está empregando machine learning para gerar sinais e fatores, bem como otimizar suas estratégias de execução para negociações mais eficazes. Destes mercados, o Japão se mostrou de longe o mais avançado na aplicação de machine learning em modelos de negociação, ao mesmo tempo em que alavancam uma gama altamente diversificada de conjuntos de dados em estratégias de investimento.
Em consenso, estamos acelerando nossos esforços para entender seu potencial.
Dados como serviço
Na era do machine learning, dados e informações financeiras se tornarão mais abundantes, além de mais preditivos e organizados. Como uma empresa líder em informações financeiras, estamos padronizando dados por meio dos chamados ‘formatos limpos’, que ajudam a desenvolver a eficiência e a capacidade de referência cruzada, fornecendo dados históricos padronizados para facilitar a análise de dados.
Nossa recém-lançada plataforma de entrega de dados baseada na web, o Bloomberg Enterprise Access Point (BEAP), busca auxiliar clientes a explorar e interagir com conjuntos de dados em massa, oferecendo ferramentas simples de manipular, modelar e visualizar. Recentemente, também adicionamos mais de 20 conjuntos de dados alternativos e não tradicionais da Bloomberg e outros provedores de dados alternativos líderes de mercado ao BEAP, incluindo insights sobre inventário de metais, sentimentos de blogueiros de ações, aprovações de medicamentos, atividades de estacionamento, alvarás de construção, risco geopolítico e utilização de aplicativos. Clientes também querem usar dados em seus aplicativos de alguma forma, por isso estamos trabalhando para entregar nossos dados em qualquer lugar, a qualquer hora. Dados estão se tornando um serviço e as futuras plataformas estão ficando mais leves e móveis.
Machine learning é fundamentalmente baseada em dados e pode ajudar investidores a rapidamente capturar relações bastante complexas. Estes, então, permitem abordar problemas que até então eram intratáveis – devido a interações complicadas nos dados, complexidade dos problemas e disponibilidade de dados ou recursos computacionais.
As técnicas e tecnologias disponíveis estão cada vez mais sofisticadas, porém a base de tudo isso e do próprio sucesso das estratégias de machine learning continua sendo a importância cada vez maior de dados de alta qualidade, vinculados e acionáveis. Empresas que compreenderem isso desde já e implementarem uma estratégia empresarial orientada por dados serão as eventuais vencedoras nesta nova era de machine learning.