BigMAAp Mackenzie


Laboratório de Big Data e Métodos Analíticos Aplicados
Saiba mais
Unsplashed background img 1


O laboratório BigMAAp está estruturado em duas grandes áreas de pesquisa, sendo essas Big Data e Métodos Analíticos, e que combinadas formam o nome do laboratório e do grupo de pesquisa. Na primeira área é tratada de forma mais específica problemas de Coleta de Dados usando as arquiteturas para Big Data e Processamento Analítico envolvendo técnicas como Aprendizagem de Máquina, Redes Neurais Artificiais, Mineração de Dados, Deep Learning e áreas afins. Na outra área está a pesquisa sobre métodos analíticos que contempla Otimização, Meta-heurísticas, modelagem de processos e afins.

O laboratório BigMAAp trata de problemáticas que envolvem grandes massas de dados (Big Data) como dados acadêmicos, redes sociais, sensores, logística e outras. Trata também de métodos analíticos aplicados a problemas combinatórios complexos cuja solução, dependendo do porte do problema, pode se dar por métodos exatos ou por métodos heurísticos.

O organograma abaixo ilustra melhor como o laboratório está estruturado em termos de linhas de pesquisa.





Linhas de Pesquisa do BigMAAp

----------------------------

A estrutura de linha de pesquisa do laboratório está assim definida:


Arquiteturamore_vert

Armazenamento e Consulta

Prof. Dr. Jamilson do Bispo Santos


Armazenamentoclose

Esta é uma linha de pesquisa que se concentra em disponibilizar um ambiente para o armazenamento de grande massas de dados (Big Data) e em diferentes formatos: estruturado e não-estrturado. Como tecnológias de pesquisa envolvidas são trabalhadas para o armazenamento as arquiteturas de banco de dados No-SQL e para o processamento Hadoop e Spark. A consulta e exploração dos dados armazenados são feitas por meio de Hive, Pig ou scripts construídos usando Linguagens R ou Python.

Exemplos de Aplicação: todo tipo de aplicação que gera um volume muito grande de dados é exemplo de pesquisa para esta área do BigMAAp. Para citar um exemplo, aplicações que envolvem IoT (Internet of Things), onde sensores são usados para monitorar alguma coisa (thing), os dados podem ser gerados na ordem de milesegundos, o que resulta em um volume muito grande de dados para armazenamento e a necessidade de arquiteturas paralelas e distribuídas para o processamento.


Analíticamore_vert

Mineração de Dados

Prof. Dr. Leandro Augusto da Silva


Mineraçãoclose

A execução de processos automatizados, nos mais variados contextos, tem produzido um volume imenso de dados que se manifestam em diferentes formatos. Todavia, todo esse volume não implica, necessariamente, em informação e conhecimento relevante para uso no apoio à tomada de decisão. Sem dúvida, não é fácil lidar com todo esse volume de dados de forma a trazer benefícios à sociedade, mas há como fazê-lo de maneira eficaz e eficiente por meio da Mineração de Dados.

A Mineração de Dados, elemento central de todo sistema Big Data, contrui-se, basicamente, pelas seguintes tarefas: predição, agrupamento e associação de dados. E em cada uma destas tarefas há conjuntos específicos de algoritmos usando técncias de Aprendizagem de Máquina e Redes Neurais Artficiais.

Exemplos de Aplicação: Toda aplicação que envolve predizer um valor desconhecido, seja numérico ou categórcio é exemplo de mineração de dados. Exemplos típicos e a predição de doenças em caso da saúde, polaridade de uma notícia publicada em rede social e etc. Também é exemplo tarefas que buscam similardade entre objetos de análise como o perfil de consumo, estilo de aprendizado de um estudante entre outros. E, finalmente, toda aplicação que procura associações em transações de um repositíro de dados que gera regras de associação do tipo quem consome um produto tem a probabilidade de fazê-lo o mesmo com outro produto de um sistema.


Gestãomore_vert

Governança de Dados

Professor Doutor Fábio Silva Lopes


Governançaclose

O uso mais efetivo e apropriado dos dados em negócios ou em propósitos científicos pode aumentar significativamente a eficiência dos produtos e serviços envolvidos. Esta agregação de valor aos dados está condicionada a uma cadeia que envolve a coleta, processamento, armazenamento, análise e visualização de grandes conjuntos de dados, oriundos de diversas fontes, em diferentes formatos. Os estudos relacionados à Cadeia de Valor de Dados (Data Value Chain ou DVC) objetivam subsidiar a construção de ecosssitemas de informação interoperáveis, com dados compartilhados por diferentes stakeholders, em plataformas governáveis e seguras, com infraestrutura, padrões, políticas e níveis de qualidade adequados, apoiadas pela pesquisa e inovação a partir do uso inteligente dos dados.

Exemplo de Aplicação: Um ecossistema acadêmico é apoiado por diversos sistemas que vão melhorar níveis de qualidade na universidade. Sistemas como matrícula, financeiro, biblioteca e AVA (Ambiente Virtual de Aprendizagem) operam as transações acadêmicas isoladamente. Cada um desses sistemas pode contribuir com dados que, quando processados e analisados em conjunto, permitem novos insights para gestores acadêmicos. Por exemplo, associando dados de uso da biblioteca aos dados de desempenho acadêmico, podemos observar correlações positivas do tipo: maiores notas, mais visitas a biblioteca. O mesmo poder ser observado pela frequencia de uso do AVA. Aspectos como estes podem contribuir para estudos de predição de evasão de alunos em cursos de graduação.


Gestãomore_vert

Formação de Pessoal

Prof. Dr. Vivaldo José Breternitz


Formação de Pessoalclose

O advento de tecnologias como as que vem sendo trabalhadas no BigMAAp, especialmente Big Data/Analytics, fez surgir novas necessidades em termos de gestão/governança de sistemas e tecnologia da informação, bem como de formação de pessoal técnico, temas que são objeto de nossas pesquisas.

Exemplos de Aplicação: Necessidade de formação de Data Scientists.


Analíticamore_vert

Aprendizagem de Máquina

Prof. Msc. Orlando Bisacchi


Aprendizagem de Máquinaclose

Constitui-se de uma área da Inteligência Artificial onde se estuda técnicas para fazer os computadores aprenderem a resolver problemas autonomamente, sem que os detalhes da solução de cada problema sejam explicitamente programados. Uma série de técnicas foram desenvolvidas para tal, como Algoritmos Genéticos, Aprendizagem por Reforço, Árvores de Decisão, Deep Learning e Redes Bayesianas, entre outras. Aprendizagem de Máquina é um dos pilares teóricos da Mineração de Dados.

Exemplos de Aplicação: algumas das principais aplicações de Aprendizagem de Máquina, que mostram que as grandes empresas estão usando essa abordagem para alterar o nosso dia-a-dia, sāo: Reconhecimento de Face (Facebook), Reconhecimento de Fala (Apple Siri, Microsoft Cortana), Tradução Automática em tempo real (Google Translator, Skype Translator) e Jogos (Google).


Simulaçãomore_vert

Sistemas Contínuos

Prof. Dr. Luís Tadeu Mendes


Simulação de sistemas contínuosclose

Trata-se de pesquisa que se aplica a processos que variam seu estado continuamente, de forma ininterrupta, numa simulação contínua o sistema se altera a cada fração de tempo pois seu estado é definido em todos os instantes.

Exemplos de Aplicaçãosimulação de um avião voando, a passagem de água por uma barragem, entre outros.


Metaheurísticamore_vert

Otimização de Sistemas

Prof. Dr. Arnaldo R. de A. Vallim Fo.


Metaheurísticasclose

São técnicas indicadas para problemas que apresentam uma multiplicidade de alternativas de soluções, gerando alta complexidade, e cuja solução por métodos exatos demandaria um tempo tendendo a infinito. As Metaheurísticas fazem uso de procedimentos matemáticos, lógicos e de uma alguma dose de bom senso. Avaliam as soluções com base em algum critério pré-definido e interrompem o processo quando um critério de parada foi alcançado. Não é um método pronto para solucionar um problema, e pode ser considerada como uma estratégia geral de solução (um framework) de uma classe de problemas.

Exemplo de Aplicação: definir as melhores rotas para entregas de encomendas em 1500 clientes localizados na região metropolitana de SP.


Sistemas Discretosmore_vert

Simulação

Prof. Dr. Péricles Turnes do Prado


Simulação de sistemas discretosclose

Em elaboração.

Exemplos de AplicaçãoEm elaboração.


Análise Estatísticamore_vert

Métodos Quantitativos

Prof. Dr. Arnaldo de Aguiar Vallim


Análise estatística close

Caracteriza-se pelo tratamento de dados em estado bruto, de forma a possibilitar a sua descrição e análise. Para a descrição dos dados há uma série de procedimentos e índices estatísticos que permitem interpretar seu padrão de comportamento. Sobre a análise, há técnicas específicas de inferência que permitem, entre outros, definir agrupamentos, correlações e estimativas de comportamentos futuros.

Exemplo de Aplicação: identificar grupos de clientes de um hipermercado que tenham características semelhantes de consumo.




MEMBROS

--------------------------------
Profa. Dra. Ana Cristina dos Santos
anacristina.santos@mackenzie.br

Prof. Dr. Arnaldo R. de A. Vallim Fo.
aavallim@gmail.com

Prof. Msc. Dirceu Matheus Júnior
dirceu.matheus@mackenzie.br

Profa. Msc. Elisângela B. Gracias
elisangela.botelho@gmail.com

Prof. Dr. Fábio Lopes
fabio.lopes@mackenzie.br

Prof. Dr. Jamilson Bispo dos Santos
jamilson.santos@mackenzie.br

Prof. Msc. Jorge Maxnuck Soares
jorgefernando.soares@mackenzie.br

Prof. Dr. Leandro Augusto da Silva
leandroaugusto.silva@mackenzie.br

Prof. Dr. Luís Tadeu Mendes Raunheitte
luis.raunheitte@mackenzie.br

Prof. Msc. Orlando Bisachi Coelho
orlandobc@gmail.com

Prof. Dr. Péricles Turnes do Prado
pericles.prado@mackenzie.br

Prof. Dr. Takato Kurihara
takato.kurihara@mackenzie.br

Prof. Dr. Vivaldo José Breternitz
vivaldojose.breternitz@mackenzie.br