Comunidade Experience – 4° DIA


Publicado em 14 de julho de 2022 – Samara Teixeira

Comunidade Experience, um nome marcante para um evento mais marcante ainda. Todos os dias desse evento já constam no nosso canal do YouTube, o Estatidados, mas aqui esse artigo irá falar sobre o quarto dia de evento. “Ah, mas o que é o Comunidade Experience?” se você não sabia, vai ficar sabendo agora!

O Comunidade Experience é um evento elaborado, com muito amor e carinho, pela nossa equipe para comemorar os 3 anos da Comunidade de Estatística. Nesse evento contamos com os nossos queridos amigos, colaboradores, palestrantes e alunos para serem nossas figuras mais importantes: os palestrantes! Essa comemoração foi pensada para, além de comemorar, cumprir mais uma vez com a nossa missão de compartilhar e democratizar cada vez mais o ensino da Estatística e todas as suas companheiras nesse mundão de dados; cada palestrante compartilhava um pouco de sua sabedoria e domínio, aumentando ainda mais o nosso network.

Nesse quarto dia contamos com dois palestrantes top das galáxias, o primeiro do dia foi o Cauê Guimarães da Purple Metrics e ele veio para fala um pouco sobre “Estatística aplicada para trade em ações no mercado americano”. O nosso segundo companheiro foi o Ricardo Limongi, professor eletivo da UFG; esse fera aqui deu uma palinha sobre “Estatística e Bibliometria: Combinação perfeita?”.

Dando uma ênfase momentânea na primeira live que rolou: iniciamos, como de costume, apresentando nosso palestrante. No currículo do mestre Cauê Guimarães podemos contar com os títulos de Doutor em Métodos Numéricos em Engenharia (UFPR), Mestre em Administração (PUCPR), MBA em Finanças pelo IBMEC, Especialista em Commodities e Derivativos no mercado americano, Graduado em Estatística (UFPR). E se isso não for o suficiente ele também possui experiência profissional em diversos setores de atividade de diferentes organizações, tais como: HSBC, GVT, TIM e EBANX. Atualmente é Data Lead na Purple Metrics. Falando agora sobre o que consta para além do laço direto com o mundo corporativo, ele foi professor no ensino superior por 8 anos, ministrando as disciplinas de estatística, métodos quantitativos, pesquisa operacional, empreendedorismo e plano de negócios.

Após a apresentação, partimos para a motivação do mestre palestrante sobre o tema, o mestre Cauê diz que é tudo questão de gosto pessoal, há o apontamento sobre os artigos escritos pelo mestre, além de uma MBA em finanças feita; outra influência para o tema foi o livro “O Homem Que Decifrou o Mercado”. Uma figura influente para o mestre Cauê foi o matemático Jim Simons – por conta de suas realizações profissionais e sua inteligência; essa figura trouxe para Guimarães a reflexão: se Jim conseguiu [realizar seus feitos] com os computadores e com a matemática da época, deve haver alguma maneira de fazer algo próximo. Se sim, como? Quais técnicas? Com qual objetivo? Em quais lugares do mundo?

O mestre Cauê cita uma live que ocorreu pelo nosso canal, com o querido Victor da Trading Com Dados, sobre como pegar cotações do AR com bolsas brasileiras e as novas visões e curiosidades despertadas nele; nisso o mestre conta suas novas descobertas e quais métricas – qual bolsa escolher?, quais ativos?, qual período? e outras mais de 150 – ele usou para chegar no que procurava; para as técnicas usadas ele cita (e explica seus prós e contras): Regressão Logística, XgBoost, Análise Discriminante Linear, Análise Discriminante Quadrática, Randon Forest.

Nesse momento chegou a primeira pergunta: de onde foram obtidos dados intraday de um período tão longo (o mestre aponta que na métrica de período, o buscado era o dia-a-dia durante 20 anos)?, a resposta dada foi a plataforma “Yahoo Finance”. Seguindo, o mestre aponta sua metodologia para esse projeto e está consta com uma previsão de subida ou descida do preço do dia seguinte – para isso foi usado Regressão Logística e Analise Discriminante -, os parâmetros era “1” se subia e “0” se caia. Usando o Randon Florest, a metodologia era a mesma, mas as respostas mais precisas usando > ou < “2”, no lugar de “1” e “0”; em todos os âmbitos eram possíveis as filtragens.

O mestre Cauê aponta os problemas enfrentados para chegar nesse modelo, alguns deles foram: o computador ter de ficar ligados por dias para processar todos os dados gerando superaquecimento, desligamento dos aparelhos ocasionando em perda de partes dos processos, entre diversas outras situações e nada disso fez o guerreiro desistir da sua missão.

Chegamos na parte operacional e o palestrante explica tintim por tintim dessa aventura. O primeiro passo era rodar o programa 30 min antes da bolsa fechar para pegar as (possíveis) ultimas atualizações diárias; seguindo, isso tudo era feito via derivativos – que são as “opções” de compra de “call” com a meta desejada e com um vencimento para a realização, caso não atinja a meta dentro do vencimento, o valor investido é negativado, com a meta atingida o valor começa a render; esse relação é basicamente uma aposta sobre o valor em relação ao tempo. Os próximos pontos são comprar os ativos com maior possibilidade e estabilizar as perdas e os ganhos de formas palpáveis.

Chegando na metade da live, mas se mantendo no assunto sobre aos derivativos, aqui é explicado o que são as travas – compra de uma ação por um preço igual ou menor que a ação vendida -, as zebras e as “a seco”. Além disso foram explicadas as trades de call e de cut, bem como as experiências, sucessos e erros do mestre Cauê. Como um plus, o mestre traz o apontamento de que Janeiro é o mês mas instável pois há muita movimentação de carteira dos acionistas.

“Por que eu não estou rico?” o mestre se faz e responde a esta pergunta, as respostas são diretas: erros na captura de cotação, entrar durante um curto período tendo muitas opções, fazer compras com estimações para o próximo dia útil contando com um longo intervalo (feriados, final de semana), estimar os ganhos pelos derivativos variáveis com relação a estratégia pelo prazo, indecisão no próximo passo e, por último mas não menos importante, a variação de comportamento do mercado. Após essa etapa o mestre respondeu algumas perguntas do chat e partiu para a finalização.

No encerramento rolou um spoiler sobre o próximo modelo que o mestre está planejando, contando com algumas características desse projeto e quais as metas que ele deseja alcançar. Aqui o mestre falou um pouco sobre as métricas “padrões” e “candle”; candle é o apontamento da máxima e a mínima do dia, além da abertura e do fechamento. Uma palinha da arquitetura dos dados do projeto também foi mostrada, o mestre explicou quais os parâmetros foram usados e quais as motivações por trás. Daqui em diante foi passado dicas de literaturas e os devidos encerramentos rolaram.

Segunda live do dia, segundo palestrante do dia e segundo tema dia. Como já citado lá em cima, essa segunda live conta com a presença ilustre do mestre Ricardo Limongi e ele traz o tema “Estatística e Bibliometria: Combinação Perfeita?”; começando a live com os costumes de sempre: apresentar o Comunidade Experience, contar sobre o que ja andou rolando por aqui e apresentando o palestrante do dia, esse que conta com currículo incrível – e que de tão extenso, precisamos resumir para caber aqui: doutor em Administração em Estratégias de Marketing pela EAESP/FGV. Pós doutorado em Economia Comportamental aplicada ao Marketing e Pós doutorado em Machine Learning aplicado ao Marketing pela UFRGS. Professor Efetivo na UFG, professor Visitante na USACH.

Iniciamos a live com o nosso palestrante explanando de maneira geral sobre a área de Bibliometria e I.A. com o intuito de fazer uma introdução aos assuntos a serem recorridos na live e nesse momento, o mestre traz a observação que saber estatística nunca é demais. Seguindo, o mestre começa a trazer a importância do Machine Learning dentro da estatística e da bibliometria; além disso o mestre traz dicas sobre artigos e produtos sobre bibliometria. Para iniciar, o mestre aponta que nessa live vai ser trago uma visão mais administrativa do assunto foco do nosso bate-papo; logo aqui há uma pergunta sobre qual a diferença da bibliometria para a cienciometria, o mestre responde que a bibliometria é a área focada no estudo das bibliografias em si.

Perto dos primeiros 20 minutos de live, o palestrante expressa sua ideologia de que “… toda ciência deve ser feita em plataformas gratuitas!” e cita algumas dessas plataformas – R e Iramuteq são exemplos -; num próximo momento, o mestre Ricardo traz o modo que ele usa para mapear e trabalhar com os dados, ele aponta que imaginar sempre de uma maneira gráfica, desenhada (inspirada na ideia da replicabilidade para próximos pesquisadores), sem contar com a clareza da explicação do processo; o segundo passo é a coleta de dados, aqui o mestre diz algumas das plataformas que ele utiliza para essa coleta e como organizar os dados coletados para um melhor resultado – esse segundo aspecto, a bibliometria em si, entra como o terceiro passo.

Ao explicar sobre Bibliometria – coleta, organização e uso dos dados -, o mestre aponta duas principais técnicas para ele: 1) a Análise de Performance, e 2) o Mapeamento da Ciência. Como Análise de Performance, mestre Ricardo aponta três métricas: a de Publicação (produtividade e constituinte), a de Citação (impacto entre citação e artigo) e a Métrica Híbrida (indicadores de produção). Sobre a segunda técnica ele aponta mais quatro situações: 1) a Análise de Autoria, 2) a Análise de Co-citação, 3) Biblographic Coupling e 4) Análise de Co-ocorrência.

Trazendo agora o subtema “Principais Contribuições”, este dividido em “teóricas” e “práticas”Para o primeiro, ele aponta as contribuições: Identificar e avaliar os conglomerados, Avaliação da rede nomológica (similaridade entre artigos) e do campo, Avaliação do campo e, por último, Identificação de lacunas (ocorrência do que está sendo criado) e direção de pesquisa. Nas contribuições práticas, são elas: Avaliação do impacto da produtividade, e Avaliação da performance epara tomada de decisão do pesquisador. Mestre Ricardo nunca deixa a desejar sobre exemplos, aplicações e explicações sobre cada um dos aspectos trazidos por ele; trazer cada um deles para esse artigo, o tornaria gigantesco, por isso aconselhamos a dar uma olhada na live!

Chegamos no meio da live, aqui o assunto é sobre “Procedimentos”. Sobre isso, o mestre aponta o fluxo usado por ele e quais as especificações de cada etapa, incluindo as necessidades de cada uma dessas etapas. Aqui também há a dica de uso do pacote do R, o Bibliometrix, constantemente falado nessa live, e a dica das Bases de Dados, para elas, as dicas são: Scopus e Clarivate Analytics.

Trazendo agora, de maneira mais profunda, o fluxo dos dados no processo de bibliometria: começando com Carregamento e conversão dos dados, passando para Análise bibliométrica descritiva e para Documento X Atributo: Matriz de Criação; nesse momento há duas etapas simultâneas, a aplicação da estatística para a redução dos dados e a criação de matriz de rede, ambas levando ao mapeamento dos dados. Mestre Limongi nunca deixando de fora a explicação sobre a aplicação de cada etapa.

Sobre a coleta de dados, o mestre explica sobre a utilização de filtros – como palavras chave, língua, entre outros – para um melhor achado; aqui houve uma pergunta sobre o uso das KeyWords Plus e o mestre diz que a melhor maneira de seguir é se basear na experiência, ver qual ferramenta se adapta melhor a sua necessidade. Sobre a exportação de dados, o mestre diz que o ideal é trabalhar com intervalo de dados, os compactando em zip logo em seguida, pois assim a leitura fica mais prática. Agora o assunto é Operadores Booleanos, que são filtros de busca para núcleos direcionados, o exemplo dado é a pesquisa de um artigo sobre Machine Learning mas sem Modelos Supervisionados, com a meta de manter até 100 artigos, por essa ser a quantidade ideal para trabalhar.

Entrando em um dos últimos assuntos da live, o Bibliometrix no RStudio, o mestre Ricardo traz para a gente o passo a passo desse processo. Além disso, o metre traz exemplos do Bibliometrix no Shiny. Sobre esses dois assuntos, não trarei mais detalhes pois na live acontece o uso e uma apresentação na prática que o mestre Limongi trouxe para a gente. Exemplos de softwares de “point and click”? Estamos tendo, também! Os exemplos dados dessa ferramenta são os CitNetExplorer e o VOSviewer. Exemplos de ferramentas online para o processo de bibliometria, também estamos tendo; aqui tem os exemplos das favoritas do mestre, as com base em I.A. são as: Elict, Connected Papers, ResearchRabbit e o Reseacher – e o mestre não deixa de fora a explicação de cada um deles e suas funções.

Finalizando o quarto dia de evento, temos a divulgação de onde os slides da live do mestre Ricardo será disponibilizado, bem como agradecimentos, avisos e divulgação dos próximos dias de live!