T2

Models/Techniques learned:

Random Forest
Bagging
AdaBoost
Neural Networks
Linear Regressian
Logistic Regressian
Naive Bayes
Classification and Regression Tree (CART)
K-nearest Neighbour (kNN)
k-Means
k-Medias

Definição de Aprendizagem

ganhar capacidades e conhecimentos
criar uma linha de raciocínio para resolver problemas
memorizar
reconhecer erros
corrigir erros
imitar comportamentos

Aprendizagem Automática / Machine Learning

Paradigma de computação em que a característica essencial do sistema se revela pela sua capacidade de aprender de modo autónomo e independente.

Note

A característica diferenciadora dos algoritmos de Machine Learning é a de que são algoritmos orientados aos dados;

Um hipotético algoritmo aprenderia o que é um determinado objeto pela definição algorítmica da configuração desse objeto;
Um algoritmo de Machine Learning aprende sem necessidade de que seja codificada a solução do problema;
Um algoritmo de Machine Learning aprende a partir de diversos exemplos desse objeto, aprendendo desse modo a identificar esse objeto.

Aprendizagem Simbólica vs Não Simbólica

Aprendizagem Simbólica (AS) refere-se ao facto de todos os passos se basearem em representações simbólicas de leitura humana do problema que utilizam a lógica e a procura para resolver o problema.

ID: ID_ti20
Number of Columns: 2
Largest Column: standard

Vantagem

O processo de raciocínio pode ser facilmente explicado
- num programa de AS é facil perceber porque é que se chega a uma determinada conclusão e quais foram os passos do raciocínio.

--- column-end ---

Desvantagem

Para o processo de aprendizagem – as regras e o conhecimento precisam ser codificados à mão
a Aprendizagem Simbólica está muito confinada ao mundo acadêmico e laboratórios universitários com pouco investimento dos gigantes da indústria

--- end-multi-column

Aprendizagem não Simbólica (AnS) tem como uma das desvantagens o facto de ser difícil compreender como é que o sistema chegou a uma conclusão.
- Isto é particularmente importante quando aplicado a
aplicações críticas, tais como condução autonoma de automóveis, diagnóstico médico, entre outras.
- Em sistemas não simbólicos, como aplicações alimentados por DL, não são aceitáveis decisões de alto risco.

Aprendizagem Supervisionada

Important

Paradigma de aprendizagem em que os casos que se usam para aprender incluem informação acerca dos resultados pretendidos, sendo possível estabelecer uma relação entre os valores pretendidos e os valores produzidos pelo sistema.

Note

A grande maioria dos algoritmos de Machine Learning usa aprendizagem supervisionada;
Aprendizagem supervisionada significa que os dados de entrada (x) e os resultados (y), tornam possível que o algoritmo aprenda uma função (f) de mapeamento dos dados nos resultados: y = f ( x );
"Supervisionada" porque este mapeamento é acompanhado por um algoritmo que supervisiona o processo de aprendizagem;

Normalmente 2 categorias:

Classificação: quando os resultados são discretos (e.g. preto, branco, cinza…);
Regressão: quando os resultados são contínuos (e.g. preço, temperatura idade,…

Aprendizagem não Supervisionada

Important

Paradigma de aprendizagem em que não são conhecidos resultados sobre os casos, apenas os enunciados dos problemas, tornando necessário a escolha de técnicas de aprendizagem que avaliem o funcionamento interno do sistema.

Note

A aprendizagem não supervisionada significa que existem dados de entrada (x) mas não existem os correspondentes resultados;
O objetivo deste tipo de aprendizagem é o de modelar a estrutura ou a distribuição dos dados do problema;

Normalmente 2 categorias:

Segmentação (clustering): quando se pretende organizar os dados em grupos coerentes (agrupar clientes que compram produtos biológicos);
Redução (reduction): reduzir o número de características de um conjunto de dados ou decompor o conjunto de dados em múltiplos componentes;
Associação: quando se pretende conhecer regras que associem o comportamento demonstrado pelos dados (pessoas que compram produtos biológicos não compram produtos de charcutaria)

Aprendizagem por Reforço

Important

Paradigma de aprendizagem que, apesar de não ter informação sobre os resultados pretendidos, permite efetuar uma avaliação sobre se os resultados produzidos são bons ou maus.

Note

Algoritmos de Reinforcement Learning usam técnicas de auto-alimentação de sinais, com vista a melhorar os resultados, por influência da noção de recompensa/penalização;
Não se pode comparar com Aprendizagem Supervisionada uma vez que a “avaliação” dos resultados não é dada por um supervisor;
Também não se pode considerar Aprendizagem não Supervisionada, uma vez que não existe ausência absoluta de informação sobre os resultados;

A aprendizagem dá-se pela capacidade de crítica sobre os próprios resultados produzidos pelo algoritmo;

Q-Learning: assume que está a seguir uma política ótima e usa-a para atualização dos valores das ações;
SARSA: considera a política de controlo que está a ser seguida e atualiza o valor das ações.

Exemplos de Aprendizagem Automática, por categoria

Aprendizagem Automática
Classificação
1. Classificação de imagem
2. Fidelização de clientes
3. Diagnóstico
4. Deteção de fraude
Regressão, exemplos:
1. Crescimento populacional
2. Previsão de mercados
3. Previsão metereológica
4. Esperança média de vida
Aprendizagem não supervisionada
Redução
1. Visualização (Big Data)
2. Compreensão de significados
3. Descoberta de Estruturas
4. Seleção de atributos
Segmentação
1. Segmentação de clientes
2. Marketing
3. Sistemas de recomendação
Aprendizagem por reforço
Aquisição de aptidões
Navegação de robots
Decisões em tempo real
Tarefas de aprendizagem
Jogos com IA

Metodologias

Porquê usar metodologias

Permite que os projetos sejam replicados;
Apoia no planeamento e gestão do projeto;
Incentiva as melhores práticas e ajuda a obter melhores resultados.

SEMMA

S - Sample: Gather a representative sample of data
E - Explore: Data exploration and analysis
M - Modify: Feature engineering and transformation
M - Model: Model conception
A - Assess: Model evaluation

Pasted image 20231213140313.png

CRISP-DM: Cross Industry Process for Data Mining

Pasted image 20231213140359.png

Fluxo de Aprendizagem Automática

Problem Definition
Data Ingestion
Data Preparation
Data Segregation
Model Training
Candidate Model Evaluation
Model Deployment
Performance Monitoring

Pasted image 20231213140543.png