Mineração de Dados

e Descoberta de Conhecimento  

DAT003/CAIA003 - CPGEI & PPGCA

     

última atualização: 26/06/2018


Informações gerais:


Cronograma:

Encontro

Dia

Assunto

Professor

Material

1

26/set

O que é mineração de dados; origens, tarefas, desafios. Atributos, tipos de dados, pré-processamento/redução de dimensionalidade e transformações.

Heitor

aula1

aula2

2

03/out

Apresentação do software Weka. Problemas de classificação: conceito e avaliação. Árvores de decisão

Heitor

weka  aula3  iris titanic eucalyptus  

3

10/out

Classificação: Regras de decisão, Bagging e boosting

Heitor

aula4  breast-cancer contraceptive

4

17/out

Exploração e visualização de dados.  OLAP. Introdução ao reconhecimento de padrões estatístico: probabilidades.

André

aula5     aula6      metodos_estatisticos

5

24/out

Classificadores Bayesianos; métodos baseados em instâncias (kNNetc).

André

 

aula7

6

31/out

Regras de associação (algoritmo Apriori)

Heitor

aula8  vote   fertility

7

07/nov

Máquinas de suporte vetorial (SVM), Kernels, One-class SVM. Modelos lineares e não-lineares

André

aula9  modelos_lineares

8

14/nov

Detecção de anomalias, Seleção de atributos e PCA. André aula10a aula10b aula10c

FeatRed

9

21/nov

Problemas de agrupamento; algoritmos e agrupamento hierárquico.

Heitor

aula11

10

28/nov

Tópicos avançados I: mineração de textos, Deep Learning

Heitor

André

aula12  sms_test_200 smsSpamCollection 

paper_contents.arff papers_deeplearning aula13 

11

05/dez

Tópicos avançados II: regressão logística, mineração de imagens, mineração de grafos

André

 

aula14  Logistic Regression

aula15  butterfly_vs_owl vehicle_images

12

12/dez

PROPOSTA DE PROJETO: Apresentação e discussão das propostas de projeto (de 1 a 2 páginas) explicando qual o objetivo do projeto, como serão construídos os datasets e quais os métodos serão utilizados. Dá-se preferência para o uso de dados reais de repositórios abertos. Esta proposta será analisada e aprovada, a aprovação será comunicada por e-mail.

Heitor

 

 
  fev/2019 ENVIO DO RELATÓRIO DO PROJETO: Envio do relatório no formato de um artigo, juntamente com os códigos e dados utilizados. O seminário de apresentação será agendado para a 1a. semana de aulas de 2019

Heitor

 

 

 


Trabalhos:

T#

Tema

Prof

Link

Datasets

Upload

1

Análise de dados

       

2

Classificação

       

3

Regras de decisão

       

4

Métodos estatísticos/OLAP

       

5

Regras de associação

       

6

SVM, classificadores lineares/não lineares, Anomalias, seleção de atributos, PCA

       

7

Análise de agrupamentos

       

8

Image mining

       

9

Text mining

       
10 Graph mining        

 

 


Materiais de apoio:


Avaliações:

T#

Alunos

Trab#1

Trab#2

Trab#3

Trab#4

Trab#5

Trab#6

Trab#7

Trab#8

Trab#9

Média trabalhos

Projeto Conceito Final