Repository logo
 

IPT - Ci2 - Teses de Mestrado ou Doutoramento

Permanent URI for this collection

Browse

Recent Submissions

Now showing 1 - 6 of 6
  • Orchestration of music emotion recognition services - automating deployment, scaling and management
    Publication . Canoso, João Pedro Bernardino; Panda, Renato
    Every day, thousands of new songs are created and distributed over the internet. These ever-increasing databases introduced the need for automatic search and organization methods, that allow users to better filter and browse such collections. However, fundamental research in the MER field is very academic, with the typical work presenting results in the form classification metrics – how good the approach worked in the tested datasets and providing access to the data and methods. In order to overcome this problem, we built and deployed a platform to orchestrate a distributed, resilient, and scalable, music emotion recognition (MER) application using Kubernetes that can be easily expanded in the future. The solution developed is based on a proof of concept that explored the usage of containers and microservices in MER but had some gaps. We reengineered and expanded it, proposing a properly orchestrated, containerbased solution, and adopting a DevOps development culture with continuous integration (CI) and continuous delivery (CD) that in an automated way, makes it easy for the different teams to focus on developing new blocks separately. At the application level, instead of analyzing the audio signal recurring to only three audio features, the system now combines a large number of audio and lyric (text) features, explores different parts of audio (vocals, accompaniment) in segments (e.g., 30-second segments instead of the full song) and uses properly trained machine learning (ML) classifiers, a contribution by Tiago António. At the orchestration level, it uses Kubernetes with Calico as the networking plugin, providing networking for the containers and pods and Rook with Ceph for the persistent block and file storage. To allow external traffic into the cluster, will use HAproxy as an external ingress controller on an external node, with BIRD providing BGP peering with Calico, allowing the communication between the pods and the external node. ArgoCD was selected as the continuous delivery tool, constantly syncing with a git repository, and thus maintaining the state of the cluster manifests up to date, which allows totally abstracting developers from the infrastructure. A monitoring stack combining Prometheus, Alertmanager and Grafana allows the constant monitoring of running iv applications and cluster status, collecting metrics that can help to understand the state of operations. The administration of the cluster can be carried out in a simplified way using Portainer. The continuous implementation pipelines run on GitHub Actions, integrating software and security tests and automatically build new versions of the containers based on tag releases and publish them on DockerHub. This implementation is fully cloud native and backed only by open source software.
  • Estudo da qualidade de ovos
    Publication . Basílio, Sonya Neves; Pinho, Henrique; Nunes, Valentim
    O objetivo do presente relatório consiste no estudo da qualidade dos ovos provenientes de três sistemas de criação de galinhas poedeiras (gaiola, solo e ar livre), a fim de identificar se o tipo de sistema afeta um conjunto de parâmetros de requisitos de qualidade dos ovos. Para tal, analisaram-se 6 ovos durante 24 semanas resultando num total de 144 ovos de cada tipo de produção. Realizaram-se análises físico-químicas no laboratório interno da Zêzerovo, tais como, dimensão da cavidade do ar, altura do albúmen, unidades de Haugh, peso do ovo cor da gema e pH do ovo. Os valores obtidos foram registados e processados recorrendo ao programa informático “QMC + EggWare”. Através do software IBM ® SPSS, procedeu-se ao tratamento estatístico dos dados recorrendo ao teste da ANOVA, e a comparações múltiplas através do teste de Tukey. Para completar o estudo, analisaram-se também resultados físico-químicos, organoléticos, microbiológicos e nutricionais determinados em laboratórios externos à Zêzerovo, S.A. Concluiu-se, do conjunto de dados analisados pelo teste ANOVA, que o tipo de sistema de criação apenas afeta a dimensão da cavidade de ar e o peso dos ovos, sendo o valor médio destes parâmetros significativamente inferior quando a criação se realiza no solo. Não se procedeu à análise estatística aos parâmetros disponibilizados pelos laboratórios externos, mas entre estes, observou-se que os parâmetros nutricionais possam ser afetados pelo sistema de criação, cuja verificação poderá ser objeto de um trabalho futuro.
  • MER: Estudo e restruturação de um sistema de reconhecimento emocional em música áudio usando o YouTube
    Publication . António, Tiago Marques; Panda, Renato
    O Reconhecimento de Emoções em Música (MER) é uma área de investigação recente, derivada da área de Recuperação de Informações em Música (MIR), que tem vindo a ganhar importância ao longo dos anos. A música está presente na história do ser humano desde que há memória, sendo utilizada nas mais diversas situações, desde entretenimento até fins mais sérios, como na medicina. Não é novidade que a música está intimamente ligada às emoções, sendo utilizada para as transmitir aos ouvintes, podendo manifestar-se de diferentes modos a nível físico e psicológico. Embora os mecanismos que relacionam a música e a emoção sejam ainda hoje bastante incompreendidos, existe vontade por parte dos investigadores da área em melhor compreender estas relações e do ponto de vista mais prático, criar sistemas que consigam identificar as emoções presentes nas músicas. O processo de identificação de emoções em sinais musicais utilizando abordagens automatizadas é deveras complexo, demorado e delicado, ligando várias áreas de conhecimento, como a psicologia, onde estão abrangidas as emoções, a área de computação, onde é realizado todo o processamento de sinal e a classificação de emoções, ou ainda a necessidade de ter alguns conhecimentos gerais sobre teoria musical. A quantidade de plataformas que atualmente demonstra este conceito é mínima, sendo na sua maioria provas de conceito com fins académicos. Neste trabalho foi desenvolvido um sistema robusto e escalável de MER, capaz de fazer o reconhecimento de emoções transmitidas em música, adaptando o modelo emocional de Russell para quatro classes: alegre, tensa, triste e calma. Este sistema partiu das lições retiradas de uma prova-de-conceito criada num projeto anterior, cuja finalidade foi perceber a exequibilidade de combinar uma abordagem MER com conceitos avançados de desenvolvimento de software. Desta, foi apenas aproveitada uma parte da aplicação web, sendo refeita toda a lógica de reconhecimento emocional, aumentando significativamente a complexidade e capacidade do sistema.O sistema atual integra vários conceitos do estado de arte na área de MER para áudio e letras de músicas (lyrics), utilizando a plataforma YouTube com fonte principal de dados. Foi treinado um classificador para a componente da letra, que permite prever uma única emoção para a letra musical através de caraterísticas extraídas da mesma. Foram desenvolvidos quatro classificadores distintos para a componente de áudio, que permitem obter múltiplas emoções para uma mesma música áudio completa, devolvendo ainda assim uma única classe por excerto. Para isto foram implementados mecanismos de separação de fontes, dividindo o áudio original em elementos musicais de voz e acompanhamento, originando três fontes de áudio (original, vocal, acompanhamento). Estas três fontes foram ainda segmentadas em excertos de 30 segundos e convertidas para mono. Esta opção teve como objetivo replicar a configuração típica de MER, em concordância com a literatura que serviu de base. Todos os excertos obtidos são classificados individualmente em uma das quatro classes, utilizando máquinas de vetores de suporte (SVMs) treinados com as caraterísticas dos áudios, extraídas através da ferramenta Essentia. As caraterísticas musicais que foram utilizadas variam entre os classificadores, pois foram utilizados algoritmos de seleção e ranking para selecionar as que mais se adequavam para cada caso específico. Os resultados obtidos pelos classificadores foram satisfatórios, com um F1-score máximo de 70,5% para o áudio, utilizando 380 características, e 66,6% para a letra, com apenas 85 características. Estes valores estão em linha com os valores baseline do artigo que nos serviu de base (áudio), onde foram obtidos 67,5% e 71,7% com 70 e 800 características respetivamente. De destacar que aqui foi usada apenas uma framework áudio, com uma eficiência computacional muito superior às académicas. Como trabalho futuro, seria interessante testar características adicionais, mais relevantes em termos musicológicos, ou ainda abordagens recentes como aprendizagem profunda. Todas estas as funcionalidades foram desenvolvidas em pequenos serviços isolados e independentes, seguindo uma arquitetura de microsserviços, criando um sistema mais tolerante a falhas, escalável e robusto. Estes serviços serão posteriormente integrados num trabalho a ocorrer em paralelo cujo foco é a orquestração de serviços da solução final de MER
  • Microsserviços para reconhecimento de emoção em música
    Publication . António, Ricardo Marques; Panda, Renato; Oliveira, Luís
    O reconhecimento de emoção em música (MER) é uma área de investigação que tem ganho notoriedade nas últimas décadas. Sabemos hoje que a música transmite emoções aos ouvintes, sendo este facto explorado para os mais diversos fins, como o entretenimento, cinema, desporto ou terapia. Por esta razão, investigadores na área de MER têm estudado a possibilidade de criar sistemas capazes de reconhecer de forma automática a emoção presente num sinal musical áudio. Este processo é extremamente complexo, tocando diversas áreas como a psicologia, com as taxonomias de emoção, mas também de ciência da computação, com processamento de sinal e aprendizagem automática, assim como a área da música. Desta forma, grande parte dos avanços permanece ainda fechada no meio académico, existindo poucos ou nenhuns sistemas deste tipo disponíveis. Este projeto visou criar um protótipo sistema robusto e escalável que sirva para demonstrar o conceito de um sistema de MER. Para isso junta os vários conceitos do estado da arte na área com metodologias modernas de engenharia de software, originando um sistema que obtém o áudio de vídeos do YouTube, sumariza o mesmo em características e classifica-o em quatro emoções distintas: alegria, agressividade, tristeza e tranquilidade. Foram desenvolvidos microsserviços distintos que implementam estas funcionalidades, através de uma arquitetura que os torna independentes, escaláveis, robustos e de alto desempenho. Este sistema vem contribuir também para a área de MER, pois facilita a divulgação da mesma fora do meio académico.
  • Desenvolvimento de infraestrutura de software do projeto Vitasenior
    Publication . Mendes, Diogo dos Santos; Panda, Renato; Oliveira, Luís
    O VITASENIOR-MT é uma plataforma de teleassistência, desenvolvida especificamente para a população idosa, que permite monitorar remotamente os dados biométricos e ambientais dos pacientes no seu conforto doméstico. Estes dados são transferidos para a infraestrutura na nuvem por intermédio de um dispositivo, Vitabox, que permite também a interação dos pacientes com o sistema através da televisão. Este relatório foca-se na componente de computação em nuvem, onde se encontram os serviços de processamento e armazenamento dos valores recolhidos, bem como a emissão de alertas e gestão do equipamento. A solução pretende transferir, processar e armazenar os valores recolhidos pelos sensores associados às Vitaboxes e aos respetivos pacientes, seguindo uma arquitetura de microsserviços, que promove escalabilidade computacional, um melhor isolamento de falhas e fácil integração entre os serviços. O sistema é também provido de um portal, onde podem ser registados médicos e cuidadores, garantindo o acompanhamento dos pacientes. A abordagem apresentada garante a segurança de dados pessoais e uma forma simplificada de recolher e apresentar os dados aos diferentes atores sem comprometer a performance do sistema. Os testes realizados comprovaram que esta solução é mais eficiente que uma abordagem monolítica, promovendo melhor acesso e controlo nos dados provenientes de equipamentos heterogêneos.
  • Vitasenior - MT : Vitabox
    Publication . Gomes, Nelson Miguel Pereira; Pires, Gabriel Pereira; Manso, António Manuel Rodrigues
    A monitorização remota dos parâmetros de saúde é uma abordagem promissora para melhorar o estado de saúde e a qualidade de vida de determinados grupos de população, e que pode também aliviar os gastos dos sistemas de saúde. Os idosos, geralmente afetados por problemas crónicos, são um grupo específico da população que pode beneficiar fortemente das tecnologias de tele-saúde, permitindo-lhes alcançar uma vida mais independente, vivendo mais tempo nas suas próprias casas. O trabalho desenvolvido neste projeto insere-se no projeto de I&D VITASENIOR-MT que tem por objetivo a implementação de um sistema de tele-saúde e teleassistência dirigido à população idosa. O projeto VITASENIOR-MT é constituído por várias partes, nomeadamente, 1) uma rede de sensores para monitorização ambiental da casa do utilizador, 2) um módulo (VITABOX) que gere a interação do utilizador com equipamentos médicos através da televisão usando o comando remoto, e que agrega todos os dados biométricos e ambientais e os reencaminha para o servidor da cloud; e 3) um sistema de informação que armazena todos os dados de todos os sistemas colocados nas várias habitações e os disponibiliza aos vários intervenientes do sistema (utilizador, cuidador e médico). Este projeto de Mestrado focou-se no desenvolvimento do módulo VITABOX. Baseado na tecnologia Nodejs, implementou-se um sistema que faz a interação com a TV através do protocolo HDMI-CEC e recebe ordens do comando remoto da TV; comunica com equipamentos biométricos (medidor de pressão arterial, balança, pulsómetro, batimento cardíaco, medição de glucose) através de Bluetooth; adquire dados ambientais da rede de sensores; disponibiliza graficamente e com áudio-descrição os dados biométricos e ambientais recolhidos. O funcionamento e usabilidade do sistema foram testados com sucesso em ambiente laboratorial e por grupos de participantes, sendo os resultados muito satisfatórios. O sistema encontra-se ainda em fase de otimização de funcionalidades e será colocado em ambiente de teste real brevemente.