Mendes, Ana de JesusCosta, Maria da GraçaMarreiros, João Miguel2025-01-242024-07http://hdl.handle.net/10400.26/53992This work focuses on improving Estimated Time of Arrival (ETA) predictions for short maritime trips using data from the Automatic Identification System (AIS) at the ports of Sines and Algarve (Faro and Portimão). Several articles and documents were consulted concerning the impact of ETA on the port’s activity planning, and how Machine Learning (ML) techniques can help improve the accuracy of those predictions. The narrative literature review showed that, despite the widespread use of machine learning models for ETA prediction in long-range voyages, there is a gap in the prediction of ETA for short trips. This is the gap this study aims to address. The primary objective is to enhance the port's operational efficiency by providing more accurate ETA data. This work used one year of real data from the AIS receivers of the ports of Sines and Algarve, in Portugal. As the work mainly focused on container ships, the data used to feed the models came from the trajectories of this type of ships with Sines as the destination. For the prediction of the Remaining Travel Time (RTT) of ships, and based on this the ETA, three machine learning models were applied: k-Nearest Neighbors (KNN), Random Forest Regression (RFR), and Multilayer Perceptron (MLP). The research includes data collection, pre-processing, and model performance analysis based on metrics such as Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), and execution time. The results indicate that MLP performed best in predictive accuracy, while RFR balanced accuracy and interpretability. Future work should explore the scalability of the models as data volumes increase and further optimize feature selection and model efficiency. It should also examine the ability of the models to maintain their performance while larger data is inputted - particularly real-time data from AIS receivers - and the standardization of some data from AIS, namely the ‘Destination’.Este trabalho teve como objetivo melhorar as previsões de chegada dos navios (em inglês Estimated Time of Arrival, ou ETA) para viagens marítimas de curta duração, utilizando dados do Sistema de Identificação Automática (em inglês Automatic Identification System, ou AIS) dos portos de Sines e do Algarve (Faro e Portimão). Foram consultados vários artigos sobre o impacto da ETA no planeamento das atividades dos portos e como as técnicas de Machine Learning podem ajudar a melhorar a precisão dessas previsões. A revisão narrativa da literatura mostrou que, apesar da utilização generalizada de modelos de aprendizagem automática para a previsão do ETA em viagens de longo curso, existe uma lacuna na previsão do ETA para viagens curtas. Esta é a lacuna que este estudo pretende ajudar a preencher. O principal objetivo é melhorar a eficiência operacional do porto, fornecendo dados de ETA mais precisos. Este trabalho utilizou um ano de dados reais provenientes dos recetores AIS dos portos de Sines e do Algarve, em Portugal. Como o trabalho se centrou principalmente nos navios porta-contentores, os dados utilizados para alimentar os modelos resultaram de trajetórias deste tipo de navios com destino a Sines. Para a previsão do tempo restante de viagem (em inglês Remaining Travel Time, ou RTT) dos navios, e consequentemente do ETA, foram aplicados três modelos de aprendizagem automática: k-Nearest Neighbors (KNN), Random Forest Regression (RFR) e Multilayer Perceptron (MLP). A investigação inclui a recolha de dados, o pré-processamento e a análise do desempenho do modelo com base em métricas como o erro quadrático médio (RMSE), o erro absoluto médio (MAE) e o tempo de execução. Os resultados indicam que o MLP teve o melhor desempenho na precisão da previsão, enquanto o RFR conseguiu equilibrar a precisão e a interpretabilidade dos dados. O trabalho futuro deve explorar a escalabilidade dos modelos à medida que os volumes de dados aumentam e otimizar ainda mais a seleção de variáveis, bem como a eficiência do modelo. Deve também examinar a capacidade dos modelos de manterem o seu desempenho quando são introduzidas maiores quantidades de dados - particularmente dados em tempo real de recetores AIS - e a normalização de alguns dados do AIS, nomeadamente o “Destino”.porEstimated Time of ArrivalAutomatic Identification SystemShort-range VoyagesMachine Learning PredictionsTempo Estimado de ChegadaSistema Automático de IdentificaçãoViagens de Curta DistânciaPrevisões com Aprendizagem AutomáticaETA prediction for short trips using AIS data from maritime portsmaster thesis203797400