Conclusão
Após a realização deste trabalho torna-se mais fácil entender a importância do processode selecção de variáveis, e como este pode afectar a previsão, ainda antes desta serefectuada.
De modo a conseguir chegar a um compromisso entre performance e número de variáveisde entrada, é fulcral compreender a importância/peso que uma dada variável tem noconjunto de saída, assim como de que forma é que as variáveis de relacionam entre si. Oprimeiro ponto é mais fácil, existindo várias ferramentas, algumas delas referidas ao longodeste trabalho, incluindo o conceito aplicado de Informação Mútua, que ajudam a determinaro peso das variáveis. A forma de como as variáveis se relacionam pode já ser algocompletamente diferente. É facil prever a sinergia entre as variáveis Hora e Dia da Semana,ou entre DAConsumo e SAConsumo pois fornece, no primeiro caso referência para o tempo, eno segundo informações sobre o comportamento da saída no passado, mas ao trabalhar comconjuntos de variáveis de entrada, podem existir relações entre elas que afectam largamenteo resultado á saída da previsão. O caso analisado das variáveis DAConsumo e SAConsumo é umexemplo disso, em que a variável SAConsumo apresenta sempre melhores resultados queDAConsumo, excepto se nos conjuntos das variáveis de entrada estiver presente ambas Hora eDia da Semana, sendo que a partir daí, DAConsumo apresentará constantemente melhoresresultados.
O conceito de Informação Mútua, apesar dos cuidados necessários a ter pré-cálculo dosíndices, foi provado conseguir demonstrar indicadores de resultados consistentes com os resultados dos testes efectuados. Existem muitas referências a realçar as possibilidades desteconceito, mas os casos encontrados da aplicação do método demonstram números muitodiferentes, apesar da sua capacidade de ser utilizado em problemas muito complexos, como éo caso do sequencionamento de genes, por exemplo.
Não existem métodos perfeitos, e as suas limitações com a utilização de variáveisdiscretas é prova disso para este caso. No entanto, recorrendo a alternativas, ou através datransformação de variáveis, ou aproximação de resultados, é possível ultrapassar esteobstáculo. No entanto, as vantagens contrastam significativamente com os obstáculos, sendoque este método permite obter uma ideia do impacto que certas variáveis irão ter nodecorrer da previsão, permitindo ao previsor ser capaz de efectuar uma análise entre onúmero de variáveis a utilizar e o aumento da performance da previsão com muito maisfacilidade.
No geral, a aplicação deste conceito passa pelos seguintes passos:
-
Tratamento da informação – Igualar o tamanho da amostra de todas as variáveis,pois quantidades de dados diferentes apresentam quantidades de informação diferentes, oque irá afectar os valores dos índices;
-
Cálculo da Matriz das Probabilidades entre a variável de teste e a variável de saída;
-
Cálculo dos índices de Informação Mútua;
-
Cálculo das importâncias relativas.
Analisando o panorama geral, o conceito de IM tem as possibilidades de ser umaferramenta muito poderosa no processo de selecção de variáveis, não só face aos resultadoscapaz de apresentar, mas devido à capacidade de computação necessária, o que torna ométodo bastante assessível.
Última Actualização: 19-05-2014