Repository logo
 

Search Results

Now showing 1 - 10 of 16
  • PREVISÃO DE ABANDONO DE ALUNOS NUMA INSTITUIÇÃO DE ENSINO SUPERIOR
    Publication . Sobreiro, Pedro; Martinho, Domingos
    O abandono é um problema nas instituições de ensino superior que tem vindo a aumentar a sua visibilidade, onde se verifica pouca investigação recorrendo a técnicas de Machine Learning. Neste estudo procuramos desenvolver um modelo para prevermos o abandono dos alunos, utilizando os dados históricos dos alunos de uma instituição de ensino superior. Os dados foram utilizados nos algoritmos de classificação Two class logistic regression, Two class boosted decision, Two class neural network e Two class support vector, onde avaliarmos a sua exatidão através da matriz de confusão e análise do Receiver Operating Characteristic curve. Os resultados obtidos permitiram identificar Two class neural network como o mais adequado para os dados que estamos a tratar. No entanto, verificamos que necessitamos de aumentar a representatividade do abandono na amostra e incorporarmos mais variáveis, como satisfação com a instituição e oportunidades de trabalho.
  • Performance in the Prediction of Dropout using the Machine Learning in Sport Services
    Publication . Sobreiro, Pedro; Pinheiro, Paulo; Santos, Abrl
    O abandono de um cliente é um fenómeno que ocorre com frequência em clientes de serviços de desporto. Este estudo, pretende avaliar o desempenho das técnicas baseadas em modelos de aprendizagem com dados, a partir dos dados disponíveis dos clientes e o histórico de utilização dos serviços de desporto, para a realização da previsão do abandono. Foram aplicadas várias técnicas para realizar a previsão, de forma a identificar qual apresentava maior exatidão, bem como uma comparação da exatidão da previsão recorrendo a uma aproximação baseada em train/test e k-fold. O algoritmo com melhor desempenho é o Gradient Boosting Classifier, em ambas as aproximações, apesar do tempo de execução ser elevado. Os resultados obtidos indiciam que não existem diferenças significativas entre a exatidão da previsão e do tempo de execução entre as técnicas utilizadas em train/test e k-fold com p>0.05 recorrendo ao MannWhitney.
  • ANÁLISE DE CLUSTERS PARA SEGMENTAÇÃO DE ESTUDANTES NUMA INSTITUIÇÃO DE ENSINO SUPERIOR
    Publication . Sobreiro, Pedro; Martinho, Domingos
    A segmentação do mercado é um tema importante para os administradores das instituições de ensino superior. A segmentação dos alunos permite a diferenciação e a definição de ações personalizadas de acordo com cada segmento e pode ser realizada recorrendo a dados existentes de alunos para serem posteriormente utilizados no desenvolvimento de ações de comunicação ou para realização de um acompanhamento interno diferenciado. A metodologia utilizada para realizarmos a segmentação dos alunos (n=280) recorreu à análise de clusters utilizando o algoritmo k-means disponível na biblioteca scikit. O k-means é um algoritmo não supervisionado para a determinação dos clusters, que requer que o investigador determine à priori o número de clusters pretendidos, utilizando uma aproximação iterativa calculando o centro ótimo de cada cluster. A identificação do número de clusters foi baseada no método elbow, que utiliza o pressuposto de que o número de clusters ótimo é aquele em que adicionando mais clusters não reduz significativamente a variância entre clusters. Depois de obtivermos cada cluster realizamos a sua caraterização utilizando as variáveis existentes para termos uma melhor compreensão dos dados. Os resultados obtidos permitiram identificar três clusters, onde obtivemos no cluster um 89 alunos, cluster dois 16 alunos e cluster três 175 alunos. Para facilitar a compreensão dos resultados obtidos realizamos a redução das variáveis existentes através de do Principal Components Analysis, uma redução de dimensões para podemos projetar os dados num espaço dimensional menor de duas dimensões, num gráfico de dispersão x,y. Realizamos a caraterização (média±desvio padrão) das variáveis idade, ano, estado civil e sexo. Os resultados obtidos evidenciam que nos clusters um, dois e três as médias de idades são aproximadamente iguais 28,29 e 31, o estado civil é maioritariamente solteiros com 80%, 81% e 75% e o sexo feminino representa 49%, 51% e 50% respetivamente. Os resultados conseguidos não são elucidativos considerando os indicadores obtidos em cada cluster. Para podermos retirar melhores conclusões deveriam ser incluídas mais variáveis, como cursos frequentados, resultados obtidos na frequência do curso e aumentar a amostra. Um aspeto que poderia ter sido equacionado seria a normalização dos dados, reduzindo impacto de variáveis em escalas diferentes na determinação do número de clusters. Por último seria interessante explorar as diferenças entre os alunos nos clusters existentes realizando a análise das variáveis existentes.
  • Sales forecast in an IT company using time series
    Publication . Sobreiro, Pedro; Martinho, Domingos; Pratas, Antonio
    The sales forecast is fundamental for the planning of the activity of the companies providing, important indicators for the support of the decisions of the managers. This study aims to explore the potential of time series prediction algorithms in an IT company. The forecast was based on the company's billing data for 192 months of activity. The analysis of the data was based on the Cross Industry Standard Process for Data Mining approach and for the treatment; we used the Anaconda IPython and Pandas. We developed the prediction with three models using R: Exponential Smoothing (Holt-Winters), autoregressive integrated moving average (ARIMA) and artificial neural networks (ANN). The comparison of the performance of each of the methods shows that the model based on artificial neural networks has a greater accuracy in the prediction. These results need deepening the study to broaden the universe of the studied contexts. However, the simplicity in the application of the artificial neural networks model makes possible its use in computer applications without specific knowledge, giving a reliable instrument that allows the supporting decision-making by managers.
  • Operacionalização da estratégia no Município de Ourém como aproximação para a promoção da saúde
    Publication . Sobreiro, Pedro; Santos-Rocha, Rita; Claudino, rui
    As iniciativas desenvolvidas para incrementar a atividade física devem ser articuladas e planeadas a partir de pressupostos para a atividade física, como a maior participação da população. O planeamento deve ser desenvolvido com o objetivo de reduzir e prevenir as doenças e promover a saúde. Assumindo a prática desportiva como algo fundamental para a saúde, é necessário identificar mecanismos que permitam agilizar esta aproximação. Numa conjuntura de fortes constrangimentos económicos, os clubes desportivos podem desempenhar um papel fundamental. Propomos uma abordagem baseada no Business Process Management que facilita a organização dos clubes e a resolução dos seus problemas, devidamente enquadrados nos pressupostos necessários para desenvolver a atividade física. Esta abordagem facilita a identificação dos requisitos dos sistemas de informação e que suportam a sua construção. Apresenta-se as etapas desenvolvidas de forma de clarificar partindo de objetivos estratégicos e decompondo-os até níveis operacionais, para dar resposta às necessidades dos clubes.
  • BUSINESS INTELLIGENCE IN THE TOOL MANAGEMENT USED BY THE CUT AND CNC MACHINES OF THE ORNAMENTAL ROCKS INDUSTRY
    Publication . Martinho, Domingos; TERESO, MARCO; Sobreiro, Pedro; Pratas, Antonio
    In the ornamental stone industry, improving production processes is a constant challenge for managers looking for solutions that improve the competitiveness of the companies. The management of cutting and computerized cut command machine tools is one of the areas where this improvement in management processes can have a positive effect on the competitiveness and productivity of companies. With this purpose, a model based on business intelligence methodologies was developed to systematize and automate the management process. The proposed model consists of the following layers: acquisition, extract, transform and load, storage and access and analysis. The acquisition layer consists of the interface with data available in various formats. The extract, transform and load process aims to extract data from these repositories and load them into a data warehouse. While the access and analysis phase is based on the use of software tools with graphical user interface with advanced analysis reporting features. The technology infrastructure is supported by the open source Tibco Jaspersoft Community Edition software package, which provides tools for the practical implementation of the defined model. With this work, it is hoped to implement the defined business intelligence model thus giving answers to the problems identified by providing information for the decision-making that corresponds to the needs of the managers.
  • PREVISÃO DO TEMPO DE PERMANÊNCIA EM DOIS LARES DO DISTRITO DE SANTARÉM
    Publication . Sobreiro, Pedro; Martinho, Domingos; Pratas, Antonio; TERESO, MARCO
    A previsão do tempo de permanência por parte dos utentes de lares, baseada na análise dos dados existentes, constitui um indicador da maior importância para os gestores deste tipo de equipamentos ajudando-os a planear os recursos necessários. Neste estudo desenvolveu-se uma análise para determinar o tempo de permanência de um idoso num lar e quais são as variáveis que influenciam esse tempo de permanência. Os dados foram analisados tendo por base o modelo de regressão de Cox onde se verificou que as variáveis faturação acumulada, Idade e distância da residência ao lar têm impacto no tempo de permanência. Na aplicação do teste log-rank encontramos diferenças na sobrevivência nas variáveis faturação acumulada e idade. Os resultados obtidos podem ser úteis para avaliação do tempo que decorre até ao abandono e dessa forma permitir planear os recursos necessários para acompanhar os utentes dos lares.
  • Predicting High-Value Customers in a Portuguese Wine Company
    Publication . Sobreiro, Pedro; Martinho, Domingos; Pratas, Antonio; Garcia-Alonso, Jose; Berrocal, Javier
    Wine companies operate in a very competitive environment in which they must provide better-customised services and products to survive and gain advantage. The high customer turnover rate is a problem for these companies. This work aims to provide wine companies with new knowledge about customers that help to retain the existing ones. The study applies a collected dataset from a transaction database in a medium-sized ortuguese wine company to determinate: (1) customer lifetime value; (2) cluster customer value as output (customer loyalty). The measurement of the customer lifetime value (CLV) was analysed using the Pareto/NBD model and gamma-gamma model. Clustering techniques are employed to segment customers according to Recency, Frequency, and Monetary (RFM) values. Study findings show that exists three clusters with different interest to the marketing strategies, identifying the high-value customers, to target using marketing to increase their lifetime value effectively. The implications for the marketing strategy decisions is that using techniques based on the RFM model can make the most from data of customers and transactions databases and thus create sustainable advantages.
  • OPERACIONALIZAÇÃO DA ESTRATÉGIA DAS ORGANIZAÇÕES DESPORTIVAS ATRAVÉS DA DEFINIÇÃO DE AXIOMAS, PARA UM CONTEXTO DE MELHORIA
    Publication . Sobreiro, Pedro; Bento, Teresa; Claudino, Rui
    O Business Process Management (BPM) pretende melhorar a eficiência das organizações através da modelação, organização e otimização dos processos de uma forma contínua. As melhorias nos processos devem ser desenvolvidas e devidamente articuladas com os objetivos estratégicos da organização, para potenciar o seu impacto na organização. Este artigo tem como objetivo propor uma abordagem para simplificar a definição de um contexto organizacional e a identificação de áreas a melhorar nas organizações desportivas. As ações de melhoria devem ser realizadas devidamente, enquadradas e integradas nos objetivos estratégicos, materializadas num contexto organizacional, que reflete as reais necessidades da organização. As melhorias são desenvolvidas no âmbito de uma iniciativa BPM. A abordagem proposta para a construção de um contexto de melhoria foi desenvolvida e baseada na análise de abordagens existentes para BPM. As etapas identificadas foram analisadas e clarificadas de forma a simplificar a construção de axiomas. Para testar a abordagem foram realizadas entrevistas com responsáveis de organizações, de forma a validar a identificação de ações de melhoria devidamente enquadradas na estratégia O resultado do estudo desenvolvido foi a clarificação de uma abordagem que facilita a identificação das ações de melhoria que as organizações desportivas necessitam de desenvolver, devidamente alinhadas com os objetivos estratégicos definidos pelos responsáveis. Os pressupostos simples desta abordagem são conseguidos através a utilização de constructos coerentes e lógicos, que permitem definir axiomas que suportam a clarificação das áreas a melhorar. A utilização de axiomas permite definir pressupostos que são facilitadores e criam contextos para ações de melhoria alinhadas e que validam a estratégia. A aplicação da abordagem permitiu identificar potencialidades na sua utilização para suportar a definição de planos estratégicos, planos de ação ou como uma reflexão organizacional. Palavras
  • A SLR on Customer Dropout Prediction
    Publication . Sobreiro, Pedro; Martinho, Domingos
    Dropout prediction is a problem that is being addressed with machine learning algorithms; thus, appropriate approaches to address the dropout rate are needed. The selection of an algorithm to predict the dropout rate is only one problem to be addressed. Other aspects should also be considered, such as which features should be selected and how to measure accuracy while considering whether the features are appropriate according to the business context in which they are employed. To solve these questions, the goal of this paper is to develop a systematic literature review to evaluate the development of existing studies and to predict the dropout rate in contractual settings using machine learning to identify current trends and research opportunities. The results of this study identify trends in the use of machine learning algorithms in different business areas and in the adoption of machine learning algorithms, including which metrics are being adopted and what features are being applied. Finally, some research opportunities and gaps that could be explored in future research are presented.